TW201933869A - 編碼裝置、解碼裝置、編碼方法及解碼方法 - Google Patents

編碼裝置、解碼裝置、編碼方法及解碼方法 Download PDF

Info

Publication number
TW201933869A
TW201933869A TW108101030A TW108101030A TW201933869A TW 201933869 A TW201933869 A TW 201933869A TW 108101030 A TW108101030 A TW 108101030A TW 108101030 A TW108101030 A TW 108101030A TW 201933869 A TW201933869 A TW 201933869A
Authority
TW
Taiwan
Prior art keywords
block
prediction
information
rectangular
divided area
Prior art date
Application number
TW108101030A
Other languages
English (en)
Inventor
加納龍一
安倍清史
遠間正真
西孝啓
Original Assignee
美商松下電器(美國)知識產權公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商松下電器(美國)知識產權公司 filed Critical 美商松下電器(美國)知識產權公司
Publication of TW201933869A publication Critical patent/TW201933869A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding

Abstract

本發明的編碼裝置具備電路及記憶體,電路利用記憶體,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理的非矩形預測,利用與周邊區塊的非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文。

Description

編碼裝置、解碼裝置、編碼方法及解碼方法
發明領域
本發明是關於一種編碼裝置、解碼裝置、編碼方法及解碼方法。
發明背景
以往存在H.265作為用以編碼動態圖像的規格。H.265亦稱為HEVC(High Efficiency Video Coding)。
先行技術文獻
非專利文獻
[非專利文獻1]H.265(ISO/IEC 23008-2 HEVC(High Efficiency Video Coding))
發明概要
發明欲解決之課題
於該類編碼方法及解碼方法,期望可提升編碼效率。
本發明的目的在於提供一種可提升編碼效率的編碼裝置、解碼裝置、編碼方法及解碼方法。
用以解決課題之手段
本發明的一態樣的編碼裝置具備電路及記憶體;前述電路利用前述記憶體,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,並就各劃分區進行預測處理之非矩形預測,利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文(context)。
本發明的一態樣的解碼裝置具備電路及記憶體;前述電路利用前述記憶體,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,並就各劃分區進行預測處理之非矩形預測,利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文。
再者,該等全面或具體的態樣亦得以系統、裝置、方法、積體電路、電腦程式、或電腦可讀取之CD-ROM等非暫時性記錄媒體來實現,或以系統、裝置、方法、積體電路、電腦程式、及記錄媒體的任意組合來實現。
發明效果
本發明的可提供一種可提升編碼效率的編碼裝置、解碼裝置、編碼方法或解碼方法。
用以實施發明之形態
本發明的一態樣的編碼裝置具備電路及記憶體,前述電路利用前述記憶體,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理的非矩形預測,利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文。
若依據此,該編碼裝置可藉由利用與周邊區塊的非矩形預測相關的資訊,來切換上下文,以提升編碼效率。
例如與前述周邊區塊的前述非矩形預測相關的前述第2資訊,亦可是表示是否對前述周邊區塊適用非矩形預測的資訊。
例如有關前述對象區塊的前述第1資訊,亦可是與前述對象區塊的前述非矩形預測相關的前述第2資訊。
例如有關前述對象區塊的前述第1資訊,亦可是表示是否對前述對象區塊適用前述非矩形預測的資訊。
例如有關前述對象區塊的前述第1資訊,亦可是有關前述對象區塊的分割的資訊。
例如前述非矩形劃分區亦可為三角形劃分區。
例如前述非矩形劃分區亦可為三角形劃分區;與前述周邊區塊的前述非矩形預測相關的前述第1資訊,亦可是表示分割前述周邊區塊後的三角形劃分區的斜邊是否包含於前述對象區塊的資訊。
例如前述周邊區塊亦可為前述對象區塊的上鄰接區塊、左鄰接區塊、左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。
例如前述周邊區塊亦可為前述對象區塊的前述上鄰接區塊或前述左鄰接區塊。
例如前述周邊區塊亦可為前述對象區塊的前述左上鄰接區塊、前述右上鄰接區塊或前述左下鄰接區塊。
例如於前述上下文的決定中,亦可進一步利用前述對象區塊或前述周邊區塊的區塊分割階層,來決定前述上下文。
例如於前述上下文的決定中,亦可進一步利用前述對象區塊或前述周邊區塊的寬高比(aspect ratio),來決定前述上下文。
本發明的一態樣的解碼裝置具備電路及記憶體;前述電路利用前述記憶體,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理的非矩形預測,利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文。
若依據此,該解碼裝置可藉由利用與周邊區塊的非矩形預測相關的資訊,來切換上下文,以提升編碼效率。
例如與前述周邊區塊的前述非矩形預測相關的前述第2資訊,亦可是表示是否對前述周邊區塊適用非矩形預測的資訊。
例如有關前述對象區塊的前述第1資訊,亦可是與前述對象區塊的前述非矩形預測相關的前述第2資訊。
例如有關前述對象區塊的前述第1資訊,亦可是表示是否對前述對象區塊適用前述非矩形預測的資訊。
例如有關前述對象區塊的前述第1資訊,亦可是有關前述對象區塊的分割的資訊。
例如前述非矩形劃分區亦可為三角形劃分區。
例如前述非矩形劃分區亦可為三角形劃分區;與前述周邊區塊的前述非矩形預測相關的前述第1資訊,亦可是表示分割前述周邊區塊經後的三角形劃分區的斜邊是否包含於前述對象區塊的資訊。
例如前述周邊區塊亦可為前述對象區塊的上鄰接區塊、左鄰接區塊、左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。
例如前述周邊區塊亦可為前述對象區塊的前述上鄰接區塊或前述左鄰接區塊。
例如前述周邊區塊亦可為前述對象區塊的前述左上鄰接區塊、前述右上鄰接區塊或前述左下鄰接區塊。
例如於前述上下文的決定中,亦可進一步利用前述對象區塊或前述周邊區塊的區塊分割階層,來決定前述上下文。
例如於前述上下文的決定中,亦可進一步利用前述對象區塊或前述周邊區塊的寬高比,來決定前述上下文。
本發明的一態樣的編碼方法是對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理的非矩形預測,利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文。
若依據此,該編碼方法可藉由利用與周邊區塊的非矩形預測相關的資訊,來切換上下文,以提升編碼效率。
本發明的一態樣的解碼方法是對藉由分割圖像所獲得的複數個區塊中之至少1個,適用將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理的非矩形預測,利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文。
若依據此,該解碼方法可藉由利用與周邊區塊的非矩形預測相關的資訊,來切換上下文,以提升編碼效率。
進而言之,該等全面或具體的態樣亦得以系統、裝置、方法、積體電路、電腦程式、或電腦可讀取之CD-ROM等非暫時性記錄媒體來實現,或以系統、裝置、方法、積體電路、電腦程式、及記錄媒體的任意組合來實現。
以下參考圖式來具體說明實施形態。
再者,以下所說明的實施形態均表示全面或具體的範例。以下實施形態所示數值、形狀、材料、構成要件、構成要件的配置位置及連接形態、步驟、步驟的順序等僅為一例,其主旨不在於限定申請專利範圍。又,關於以下實施形態的構成要件中,未記載於表示最高位概念的獨立請求項的構成要件,則作為任意的構成要件來說明。
(實施形態1)
首先,說明實施形態1的概要,來作為可適用後述的本發明的各態樣所說明的處理及/或構成的編碼裝置及解碼裝置的一例。但實施形態1僅為可適用本發明的各態樣所說明的處理及/或構成的編碼裝置及解碼裝置的一例,本發明的各態樣所說明的處理及/或構成,亦可於與實施形態1不同的編碼裝置及解碼裝置實施。
對於實施形態1適用本發明的各態樣所說明的處理及/或構成時,亦可進行例如以下之任一項。
(1)對於實施形態1的編碼裝置或解碼裝置,將構成該編碼裝置或解碼裝置的複數個構成要件中之對應於本發明的各態樣所說明的構成要件之構成要件,置換成本發明的各態樣所說明的構成要件;
(2)對於實施形態1的編碼裝置或解碼裝置,針對構成該編碼裝置或解碼裝置的複數個構成要件中之一部分構成要件,施以功能或實施處理的追加、置換、刪除等任意變更後,將對應於本發明的各態樣所說明的構成要件之構成要件,置換成本發明的各態樣所說明的構成要件;
(3)對於實施形態1的編碼裝置或解碼裝置所實施的方法,針對處理的追加、及/或該方法所含的複數種處理中之一部分處理,施以置換、刪除等任意變更後,將對應於本發明的各態樣所說明的處理之處理,置換成本發明的各態樣所說明的處理;
(4)將構成實施形態1的編碼裝置或解碼裝置的複數個構成要件中之一部分構成要件,與本發明的各態樣所說明的構成要件、具備本發明的各態樣所說明的構成要件所具備的一部分功能的構成要件、或實施本發明的各態樣所說明的構成要件所實施的一部分處理的構成要件組合而實施;
(5)將具備構成實施形態1的編碼裝置或解碼裝置的複數個構成要件中之一部分構成要件所具備的一部分功能的構成要件、或實施構成實施形態1的編碼裝置或解碼裝置的複數個構成要件中之一部分構成要件所實施的一部分處理的構成要件,與本發明的各態樣所說明的構成要件、具備本發明的各態樣所說明的構成要件所具備的一部分功能的構成要件、或實施本發明的各態樣所說明的構成要件所實施的一部分處理的構成要件組合而實施;
(6)對於實施形態1的編碼裝置或解碼裝置所實施的方法,將該方法所含的複數種處理中之對應於本發明的各態樣所說明的處理之處理,置換成本發明的各態樣所說明的處理;
(7)將實施形態1的編碼裝置或解碼裝置所實施的方法所含之複數種處理中之一部分處理,與本發明的各態樣所說明的處理組合而實施。
再者,本發明的各態樣所說明的處理及/或構成的實施方式,不限定於上述例子。例如在與實施形態1所揭示的動態圖像/圖像編碼裝置或動態圖像/圖像解碼裝置,以不同目的利用的裝置實施,或單獨實施各態樣所說明的處理及/或構成均可。又,亦可組合在不同態樣所說明的處理及/或構成而實施。
[編碼裝置的概要]
首先,說明實施形態1的編碼裝置的概要。圖1是表示實施形態1之編碼裝置100的功能構成之方塊圖。編碼裝置100是以區塊為單位編碼動態圖像/圖像的動態圖像/圖像編碼裝置。
如圖1所示,編碼裝置100是以區塊為單位編碼圖像的裝置,具備分割部102、減算部104、轉換部106、量化部108、熵編碼部110、反量化部112、反轉換部114、加算部116、區塊記憶體118、迴路濾波部120、幀記憶體122、幀內預測部124、幀間預測部126及預測控制部128。
編碼裝置100藉由例如通用處理器及記憶體來實現。此時,由處理器執行儲存於記憶體的軟體程式時,處理器是作為分割部102、減算部104、轉換部106、量化部108、熵編碼部110、反量化部112、反轉換部114、加算部116、迴路濾波部120、幀內預測部124、幀間預測部126及預測控制部128發揮功能。又,編碼裝置100亦可作為對應於分割部102、減算部104、轉換部106、量化部108、熵編碼部110、反量化部112、反轉換部114、加算部116、迴路濾波部120、幀內預測部124、幀間預測部126及預測控制部128的專用的1以上的電子電路來實現。
以下說明編碼裝置100所含的各構成要件。
[分割部]
分割部102將輸入動態圖像所含的各圖片,分割為複數個區塊,將各區塊輸出至減算部104。例如分割部102首先將圖片分割為固定大小(例如128´128)的區塊。該固定大小的區塊有時稱為編碼樹單元(CTU)。然後,分割部102根據遞迴的四元樹(quadtree)及/或二元樹(binary tree)區塊分割,將固定大小的區塊的各個分割為可變大小(例如64´64)的區塊。該可變大小的區塊有時稱為編碼單元(CU)、預測單元(PU)或轉換單元(TU)。再者,於本實施形態無須區分CU、PU及TU,圖片內的一部分或所有區塊為CU、PU、TU的處理單位亦可。
圖2是表示實施形態1的區塊分割的一例的圖。於圖2,實線表示四元樹區塊分割的區塊邊界,虛線表示二元樹區塊分割的區塊邊界。
於此,區塊10為128´128像素的正方形區塊(128´128區塊)。該128´128區塊10首先分割為4個正方形的64´64區塊(四元樹區塊分割)。
左上64´64區塊進一步垂直分割為2個矩形的32´64區塊,左32´64區塊進一步垂直分割為2個矩形的16´64區塊(二元樹區塊分割)。其結果,左上64´64區塊分割為2個16´64區塊11、12及32´64區塊13。
右上64´64區塊水平分割為2個矩形的64´32區塊14、15(二元樹區塊分割)。
左下64´64區塊分割為4個正方形的32´32區塊(四元樹區塊分割)。4個32´32區塊中,左上區塊及右下區塊進一步分割。左上32´32區塊垂直分割為2個矩形的16´32區塊,右16´32區塊進一步水平分割為2個16´16區塊(二元樹區塊分割)。右下32´32區塊水平分割為2個32´16區塊(二元樹區塊分割)。其結果,左下64´64區塊分割為16´32區塊16、2個16´16區塊17、18、2個32´32區塊19、20及2個32´16區塊21、22。
右下64´64區塊23未分割。
如以上,於圖2,區塊10根據遞迴的四元樹及二元樹區塊分割,分割為13個可變大小的區塊11~23。此類分割有時稱為QTBT(quad-tree plus binary tree(四元樹加二元樹))分割。
再者,於圖2,1個區塊分割為4個或2個區塊(四元樹或二元樹區塊分割),但分割不限定於此。例如1個區塊亦可分割為3個區塊(三元樹區塊分割)。該類包含三元樹區塊分割在內的分割有時稱為MBT(multi type tree(多型樹))分割。
[減算部]
減算部104是以分割部102所分割的區塊單位,從原訊號(原樣本)減算預測訊號(預測樣本)。總言之,減算部104算出編碼對象區塊(以下稱為目前區塊)的預測誤差(亦稱為殘差)。然後,減算部104將算出的預測誤差輸出至轉換部106。
原訊號為編碼裝置100的輸入訊號,其為表示構成動態圖像的各圖片之圖像的訊號(例如亮度(luma)訊號及2個色差(chroma)訊號)。以下有時亦將表示圖像的訊號稱為樣本。
[轉換部]
轉換部106將空間域的預測誤差,轉換成頻率域的轉換係數,將轉換係數輸出至量化部108。具體而言,轉換部106對於例如空間域的預測誤差,進行預先決定的離散餘弦轉換(DCT)或離散正弦轉換(DST)。
再者,轉換部106亦可從複數種轉換類型中,適應性地選擇轉換類型,利用與選擇的轉換類型相對應的轉換基函數(transform basis function),將預測誤差轉換成轉換係數。該類轉換有時稱為EMT(explicit multiple core transform(顯式多重核心轉換))或AMT(adaptive multiple transform(適應性多重轉換))。
複數種轉換類型包含例如DCT-II、DCT-V、DCT-VIII、DST-I及DST-VII。圖3是表示對應於各轉換類型的轉換基函數的表。於圖3,N表示輸入像素數。從該等複數種轉換類型選擇轉換類型時,可取決於例如預測的種類(幀內預測及幀間預測),或取決於幀內預測模式。
該類表示適用EMT或AMT與否的資訊(例如稱為AMT旗標)、及表示選擇的轉換類型的資訊是以CU級別來訊號化。再者,該等資訊的訊號化無須限定在CU級別,亦可為其他級別(例如序列級別、圖片級別、切片級別、方塊級別或CTU級別)。
又,轉換部106亦可將轉換係數(轉換結果)予以再轉換。該類再轉換有時稱為AST(adaptive secondary transform(適應性第二轉換))或NSST(non-separable secondary transform(非分離第二轉換))。例如轉換部106就對應於幀內預測誤差的轉換係數的區塊所含子區塊(例如4´4子區塊),逐一進行再轉換。表示適用NSST與否的資訊、及用於NSST的轉換矩陣的相關資訊是以CU級別來訊號化。再者,該等資訊的訊號化無須限定在CU級別,亦可為其他級別(例如序列級別、圖片級別、切片級別、方塊級別或CTU級別)。
於此,Separable(可分離)轉換是指就各方向,僅分離輸入的維數而進行複數次轉換的方式,Non-Separable(不可分離)轉換是指在輸入為多維時,將2個以上的維度統整視為1維而統一進行轉換的方式。
例如作為Non-Separable轉換的一例,可舉出在輸入為4´4的區塊時,將其視為具有16個要件的1個陣列,對於該陣列,以16´16的轉換矩陣進行轉換處理。
又,同樣地將4´4的輸入區塊視為具有16個要件的1個陣列,對於該陣列,進行複數次吉文斯(Givens)旋轉(Hypercube Givens Transform(超立方體吉文斯轉換))的轉換,亦為Non-Separable轉換例。
[量化部]
量化部108量化從轉換部106輸出的轉換係數。具體而言,量化部108以預定的掃描順序掃描目前區塊的轉換係數,根據對應於經掃描的轉換係數的量化參數(QP),來量化該轉換係數。然後,量化部108將目前區塊的經量化的轉換係數(以下稱為量化係數),輸出至熵編碼部110及反量化部112。
預定的順序是轉換係數的量化/反量化用的順序。例如預定的掃描順序是以頻率的升序(從低頻往高頻的順序)或降序(從高頻往低頻的順序)定義。
量化參數是定義量化步階(量化寬)的參數。例如若增加量化參數值,則量化步階亦增加。總言之,若量化參數值增加,則量化誤差增大。
[熵編碼部]
熵編碼部110將從量化部108輸入的量化係數,予以可變長度編碼,藉此來生成編碼訊號(編碼位元串流)。具體而言,熵編碼部110例如將量化係數二值化,將二值訊號予以算術編碼。
[反量化部]
反量化部112將來自量化部108的輸入即量化係數,予以反量化。具體而言,反量化部112以預定的掃描順序,將目前區塊的量化係數予以反量化。然後,反量化部112將目前區塊之已被反量化的轉換係數,輸出至反轉換部114。
[反轉換部]
反轉換部114將來自反量化部112的輸入即轉換係數,予以反轉換,藉此復原預測誤差。具體而言,反轉換部114藉由對於轉換係數,進行與轉換部106的轉換相對應的反轉換,來復原目前區塊的預測誤差。然後,反轉換部114將復原的預測誤差輸出至加算部116。
再者,由於復原的預測誤差是因量化而喪失資訊,因此不會與減算部104所算出的預測誤差一致。亦即,於復原的預測誤差,包含有量化誤差。
[加算部]
加算部116藉由加算從反轉換部114輸入的預測誤差與從預測控制部128輸入的預測樣本,來重構目前區塊。然後,加算部116將重構的區塊輸出至區塊記憶體118及迴路濾波部120。重構區塊有時亦稱為局部解碼區塊。
[區塊記憶體]
區塊記憶體118是用以儲存幀內預測所參考,且為編碼對象圖片(以下稱為目前圖片)內的區塊的記憶部。具體而言,區塊記憶體118儲存從加算部116輸出的重構區塊。
[迴路濾波部]
迴路濾波部120對於由加算部116重構的區塊,施以迴路濾波,將已濾波的重構區塊輸出至幀記憶體122。迴路濾波器是在編碼迴路內使用的濾波器(迴路內濾波器),包含例如去區塊濾波器(DF)、樣本適用性偏移(SAO)及適應性迴路濾波器(ALF)等。
ALF適用用以去除編碼失真的最小平方誤差濾波器,例如就目前區塊內的2´2子區塊,逐一適用根據局部梯度(gradient)的方向及活性度(activity)而從複數個濾波器中選擇的1個濾波器。
具體而言,首先子區塊(例如2´2子區塊)分類為複數個組別(例如15或25組)。子區塊的分類是根據梯度的方向及活性度來進行。例如利用梯度的方向值D(例如0~2或0~4)及梯度的活性值A(例如0~4),來算出分類值C(例如C=5D+A)。然後,根據分類值C,將子區塊分類為複數個組別(例如15或25組)。
梯度的方向值D是藉由例如比較複數個方向(例如水平、垂直及2個對角方向)的梯度來導出。又,梯度的活性值A是藉由例如加算複數個方向的梯度,量化加算結果來導出。
根據此類分類的結果,從複數個濾波器中決定子區塊用的濾波器。
ALF所用濾波器的形狀可利用例如圓對稱形狀。圖4A~圖4C是表示ALF所用濾波器的形狀的複數例之圖。圖4A表示5´5菱形形狀濾波器,圖4B表示7´7菱形形狀濾波器,圖4C表示9´9菱形形狀濾波器。表示濾波器形狀的資訊是以圖片級別訊號化。再者,表示濾波器形狀的資訊的訊號化無須限定在圖片級別,亦可為其他級別(例如序列級別、切片級別、方塊級別、CTU級別或CU級別)。
ALF的開啟/關閉是以例如圖片級別或CU級別來決定。例如就亮度而言,以CU級別決定是否適用ALF,就色差而言,以圖片級別決定是否適用ALF。表示ALF的開啟/關閉的資訊是以圖片級別或CU級別來訊號化。再者,表示ALF的開啟/關閉的資訊的訊號化無須限定在圖片級別或CU級別,亦可為其他級別(例如序列級別、切片級別、方塊級別或CTU級別)。
可選擇的複數個濾波器(例如從15到25的濾波器)的係數集合是以圖片級別訊號化。再者,係數集合的訊號化無須限定在圖片級別,亦可為其他級別(例如序列級別、切片級別、方塊級別、CTU級別、CU級別或子區塊級別)。
[幀記憶體]
幀記憶體122是用以儲存幀間預測所用的參考圖片的記憶部,有時亦稱為幀緩衝器。具體而言,幀記憶體122儲存由迴路濾波部120所濾波的重構區塊。
[幀內預測部]
幀內預測部124參考儲存於區塊記憶體118的目前圖片內的區塊,來進行目前區塊的幀內預測(亦稱為畫面內預測),藉此生成預測訊號(幀內預測訊號)。具體而言,幀內預測部124參考鄰接於目前區塊的區塊的樣本(例如亮度值、色差值),來進行幀內預測,藉此生成幀內預測訊號,將幀內預測訊號輸出至預測控制部128。
例如幀內預測部124利用預先規定的複數種幀內預測模式中之一種,進行幀內預測。複數種幀內預測模式包含1以上的非方向性預測模式及複數種方向性預測模式。
1以上的非方向性預測模式包含例如H.265/HEVC(High-Efficiency Video Coding(高效率視訊編碼))規格(非專利文獻1)所規定的Planar(平面)預測模式及DC預測模式。
複數種方向性預測模式包含例如H.265/HEVC規格所規定的33方向的預測模式。再者,複數種方向性預測模式除了33方向以外,亦可進一步包含32方向的預測模式(合計65個方向性預測模式)。圖5A是表示幀內預測之67個幀內預測模式(2個非方向性預測模式及65個方向性預測模式)之圖。實線箭頭表示H.265/HEVC規格所規定的33方向,虛線箭頭表示追加的32方向。
再者,於色差區塊的幀內預測中,亦可參考亮度區塊。總言之,亦可根據目前區塊的亮度成分,來預測目前區塊的色差成分。該類幀內預測有時稱為CCLM(cross-component linear model(跨組件線性模式))預測。該類參考亮度區塊的色差區塊的幀內預測模式(例如稱為CCLM模式)亦可加入作為色差區塊的幀內預測模式之一。
幀內預測部124亦可根據水平/垂直方向的參考像素的梯度,來修正幀內預測後的像素值。伴隨有該類修正的幀內預測有時稱為PDPC(position dependent intra prediction combination(位置相依之幀內預測組合))。表示PDPC之適用的有無的資訊(稱為例如PDPC旗標)是以CU級別來訊號化。再者,該資訊的訊號化無須限定在CU級別,亦可為其他級別(例如序列級別、圖片級別、切片級別、方塊級別或CTU級別)。
[幀間預測部]
幀間預測部126參考儲存於幀記憶體122的參考圖片,且與目前圖片不同的參考圖片,來進行目前圖片的幀間預測(亦稱為畫面間預測),藉此生成預測訊號(幀間預測訊號)。幀間預測是以目前區塊或目前區塊內的子區塊(例如4´4區塊)的單位進行。例如幀間預測部126針對目前區塊或子區塊,進行參考圖片內移動估計(motion estimation)。然後,幀間預測部126利用藉由移動估計所獲得的移動資訊(例如移動向量),來進行移動補償,藉此生成目前區塊或子區塊的幀間預測訊號。然後,幀間預測部126將生成的幀間預測訊號輸出至預測控制部128。
用於移動補償的移動資訊被訊號化。移動向量的訊號化亦可利用移動向量預測子(motion vector predictor)。總言之,亦可將移動向量與移動向量預測子之間的差距訊號化。
再者,不僅可利用藉由移動估計所獲得的目前區塊的移動資訊,亦可利用鄰接區塊的移動資訊,來生成幀間預測訊號。具體而言,亦可將根據藉由移動估計所獲得的移動資訊的預測訊號、與根據鄰接區塊的移動資訊的預測訊號,予以加算權重,藉此以目前區塊內的子區塊為單位來生成幀間預測訊號。該類幀間預測(移動補償)有時稱為OBMC(overlapped block motion compensation(重疊區塊移動補償))。
於該類OBMC模式,表示OBMC用子區塊的大小的資訊(例如稱為OBMC區塊大小)是以序列級別訊號化。又,表示適用OBMC模式與否的資訊(例如稱為OBMC旗標)是以CU級別來訊號化。再者,該等資訊的訊號化級別無須限定在序列級別及CU級別,亦可為其他級別(例如圖片級別、切片級別、方塊級別、CTU級別或子區塊級別)。
更具體說明OBMC模式。圖5B及圖5C是用以說明OBMC處理的預測圖像修正處理的概要的流程圖及概念圖。
首先,利用分派給編碼對象區塊的移動向量(MV),取得一般的移動補償的預測圖像(Pred)。
接著,將編碼完畢的左鄰接區塊的移動向量(MV_L),適用於編碼對象區塊,取得預測圖像(Pred_L),將前述預測圖像與Pred_L加權並重疊,藉此進行預測圖像的第1次修正。
同樣地,將編碼完畢的上鄰接區塊的移動向量(MV_U),適用於編碼對象區塊,取得預測圖像(Pred_U),將已進行前述第1次修正的預測圖像與Pred_U加權並重疊,藉此進行預測圖像的第2次修正,將其作為最終的預測圖像。
再者,於此說明了利用左鄰接區塊及上鄰接區塊的2階段修正的方法,但亦可採用利用右鄰接區塊或下鄰接區塊,進行次數多於2階段的修正的構成。
再者,進行重疊的區域非區塊全體的像素區域,亦可僅為區塊邊界附近的一部分區域。
再者,於此說明了從1張參考圖片進行的預測圖像修正處理,但從複數張參考圖片修正預測圖像的情況亦同樣如此,取得從各個參考圖片修正的預測圖像後,進一步重疊獲得的預測圖像以作為最終的預測圖像。
再者,前述處理對象區塊是預測區塊為單位,或進一步分割預測區塊而成的子區塊為單位均可。
作為判定是否適用OBMC處理的方法,包括例如利用表示是否適用OBMC處理的訊號obmc_flag的方法。具體例是於編碼裝置,判定編碼對象區塊是否屬於移動複雜的區域,若屬於移動複雜的區域時,obmc_flag設定值1,適用OBMC處理而進行編碼,不屬於移動複雜的區域時,obmc_flag設定值0,不適用OBMC處理而進行編碼。另,於解碼裝置,藉由解碼串流所描述的obmc_flag,因應其值來切換是否適用OBMC處理而進行解碼。
再者,移動資訊亦可未訊號化,而從解碼裝置側導出。例如亦可利用H.265/HEVC規格所規定的合併模式。又,例如亦可藉由在解碼裝置側進行移動估計,來導出移動資訊。此時,不利用目前區塊的像素值而進行移動估計。
於此,說明有關在解碼裝置側進行移動估計的模式。該在解碼裝置側進行移動估計的模式有時稱為PMMVD(pattern matched motion vector derivation(模式匹配移動向量導出))模式或FRUC(frame rate up-conversion(幀率提升轉換))模式。
於圖5D表示FRUC處理的一例。首先,參考與目前區塊在空間上或時間上鄰接的編碼完畢區塊的移動向量,生成各個具有移動向量預測子的複數個候補清單(亦可與合併清單共通)。接著,從登錄於候補清單的複數個候補MV之中,選擇最佳候補MV。例如算出候補清單所含的各候補的評估值,根據評估值選擇1個候補。
然後,根據選擇的候補移動向量,導出目前區塊用的移動向量。具體而言,例如選擇的候補移動向量(最佳候補MV)直接被導出作為目前區塊用的移動向量。又,例如在對應於選擇的候補移動向量的參考圖片內的位置的周邊區域,進行模式匹配,藉此導出目前區塊用的移動向量亦可。亦即,對於最佳候補MV的周邊區域,以同樣的方法進行估計,若有評估值為更佳數值的MV時,將最佳候補MV更新為前述MV,將其作為目前區塊的最終MV亦可。再者,亦可採用不實施該處理的構成。
以子區塊為單位進行處理時,亦可採用完全同樣的處理。
再者,評估值是藉由對應於移動向量的參考圖片內的區域、與預定區域之間的圖案匹配,所求出之重構圖像的差分值來算出。再者,除了差分值以外,亦可利用其以外的資訊來算出評估值。
模式匹配利用第1模式匹配及第2模式匹配。第1模式匹配及第2模式匹配有時分別稱為雙向匹配(bilateral matching)及模板匹配(template matching)。
於第1模式匹配,在不同的2個參考圖片內的2個區塊,且沿著目前區塊的移動軌道(motion trajectory)的2個區塊之間,進行模式匹配。因此,於第1模式匹配,利用沿著目前區塊的移動軌道之其他參考圖片內的區域,來作為上述候補評估值的算出所用的預定區域。
圖6是用以說明沿著移動軌道的2個區塊間之模式匹配(雙向匹配)之圖。如圖6所示,於第1模式匹配,藉由估計沿著目前區塊(Cur block)的移動軌道的2個區塊,且不同的2個參考圖片(Ref0,Ref1)內的2個區塊的配對中最匹配的配對,來導出2個移動向量(MV0,MV1)。具體而言,對於目前區塊,導出由候補MV指定的第1編碼完畢參考圖片(Ref0)內的指定位置的重構圖像、與由對稱MV指定的第2編碼完畢參考圖片(Ref1)內的指定位置的重構圖像的差分,利用獲得的差分值來算出評估值,前述對稱MV是將前述候補MV以顯示時間間隔縮放。選擇複數個候補MV之中評估值為最佳值的候補MV,來作為最終MV。
假定是連續的移動軌道,指示2個參考區塊的移動向量(MV0,MV1)會對目前圖片(Cur Pic)與2個參考圖片(Ref0,Ref1)之間的時間距離(TD0,TD1)成比例。例如目前圖片在時間上位於2個參考圖片之間,從目前圖片到2個參考圖片的時間距離相等時,於第1模式匹配,導出反射對稱的雙向移動向量。
於第2模式匹配,在目前圖片內的模板(在目前圖片內,鄰接於目前區塊的區塊(例如上及/或左鄰接區塊))與參考圖片內的區塊之間,進行模式匹配。因此,於第2模式匹配,利用目前圖片內鄰接於目前區塊的區塊,來作為上述候補評估值算出用的預定區域。
圖7是用以說明目前圖片內的模板與參考圖片內的區塊之間的模式匹配(模板匹配)之一例的圖。如圖7所示,於第2模式匹配,藉由於參考圖片(Ref0)內,估計與目前圖片(Cur Pic)內鄰接於目前區塊(Cur block)的區塊最匹配的區塊,來導出目前區塊的移動向量。具體而言,對於目前區塊,導出左鄰接及上鄰接之雙方或某一方的編碼完畢區域的重構圖像、與由候補MV指定的編碼完畢參考圖片(Ref0)內的同等位置的重構圖像的差分,利用獲得的差分值算出評估值,選擇複數個候補MV之中評估值為最佳值的候補MV,來作為最佳候補MV即可。
表示適用該類FRUC模式與否的資訊(例如稱為FRUC旗標)是以CU級別來訊號化。又,適用FRUC模式時(例如FRUC旗標為真時),表示模式匹配方法(第1模式匹配或第2模式匹配)的資訊(例如稱為FRUC模式旗標)是以CU級別來訊號化。再者,該等資訊的訊號化無須限定在CU級別,亦可為其他級別(例如序列級別、圖片級別、切片級別、方塊級別、CTU級別或子區塊級別)。
於此,說明根據假定等速直線運動的模型,來導出移動向量的模式。該模式有時稱為BIO(bi-directional optical flow(雙向光流))模式。
圖8是用以說明假定等速直線運動的模型之圖。於圖8,(vx ,vy )表示速度向量,t0 、t1 分別表示目前圖片(Cur Pic)與2個參考圖片(Ref0 ,Ref1 )之間的時間距離。(MVx0 ,MVy0 )表示對應於參考圖片Ref0 的移動向量,(MVx1 ,MVy1 )表示對應於參考圖片Ref1 的移動向量。
此時,在速度向量(vx ,vy )的等度直線運動的假定下,(MVx0 ,MVy0 )及(MVx1 ,MVy1 )分別表示為(vx τ0 ,vy τ0 )及(-vx τ1 ,-vy τ1 ),以下光流等式(1)成立。
[數1]
於此,I(k) 表示移動補償後的參考圖像k(k=0,1)的亮度值。該光流等式表示(i)、(ii)與(iii)的和等於零,其中(i)亮度值的時間微分,(ii)水平方向的速度及參考圖像的空間梯度的水平成分的積,(iii)垂直方向的速度及參考圖像的空間梯度的垂直成分的積。根據該光流等式與赫米特內插法(Hermite interpolation)的組合,以像素單位修正從合併清單等所獲得的區塊單位的移動向量。
再者,以與根據假定等速直線運動的模型的移動向量的導出不同的方法,在解碼裝置側導出移動向量亦可。例如根據複數個鄰接區塊的移動向量,以子區塊為單位來導出移動向量亦可。
於此,說明根據複數個鄰接區塊的移動向量,以子區塊為單位來導出移動向量的模式。該模式有時稱為仿射移動補償預測(affine motion compensation prediction)模式。
圖9A是用以說明根據複數個鄰接區塊的移動向量來導出子區塊單位的移動向量之圖。於圖9A,目前區塊包含16之4´4子區塊。於此,根據鄰接區塊的移動向量,來導出目前區塊左上角控制點的移動向量v0 ,根據鄰接子區塊的移動向量,來導出目前區塊右上角控制點的移動向量v1 。然後,利用2個移動向量v0 及v1 ,藉由下式(2)來導出目前區塊內的各子區塊的移動向量(vx ,vy )。
[數2]
於此,x及y分別表示子區塊的水平位置及垂直位置,w表示預先決定的加權係數。
於該類仿射移動補償預測模式,亦可包含左上及右上角控制點的移動向量導出方法不同的數種模式。表示該類仿射移動補償預測模式的資訊(例如稱為仿射旗標)是以CU級別來訊號化。再者,表示該仿射移動補償預測模式的資訊的訊號化無須限定在CU級別,亦可為其他級別(例如序列級別、圖片級別、切片級別、方塊級別、CTU級別或子區塊級別)。
[預測控制部]
預測控制部128選擇幀內預測訊號及幀間預測訊號的任一者,將選擇的訊號作為預測訊號而輸出至減算部104及加算部116。
於此,說明藉由合併模式來導出編碼對象圖片的移動向量之例。圖9B是用以說明利用合併模式的移動向量導出處理的概要的圖。
首先,生成登錄有預測MV的候補的預測MV清單。預測MV的候補包括:空間鄰接預測MV,其為空間上位於編碼對象區塊周邊的複數個編碼完畢區塊所具有的MV;時間鄰接MV,其為投影有編碼完畢參考圖片的編碼完畢區塊的位置附近的區塊所具有的MV;結合預測MV,其為組合空間鄰接預測MV與時間鄰接預測MV的MV值而生成的MV;及值為零的MV,即零預測MV等。
接著,藉由從登錄於預測MV清單的複數個預測MV之中,選擇1個預測MV,來決定作為編碼對象區塊的MV。
進而於可變長度編碼部,將表示選擇的預測MV為何的訊號,即merge_idx,描述於串流而編碼。
再者,圖9B所說明的登錄於預測MV清單的預測MV為一例,亦可個數與圖中的個數不同,亦或為不包含圖中的預測MV的一部分種類的構成,亦或為追加有圖中的預測MV的種類以外的預測MV的構成。
再者,亦可藉由利用合併模式導出的編碼對象區塊的MV,進行後述的DMVR處理,來決定最終的MV。
於此,說明利用DMVR處理來決定MV之例。
圖9C是用以說明DMVR處理的概要的概念圖。
首先,將設定於處理對象區塊的最佳MVP作為候補MV,按照前述候補MV,從L0方向的處理完畢圖片之第1參考圖片、及從L1方向的處理完畢圖片之第2參考圖片,分別取得參考像素,並取各參考像素的平均來生成模板。
接著,利用前述模板,分別估計第1參考圖片及第2參考圖片的候補MV的周邊區域,決定成本最小的MV來作為最終的MV。再者,成本值是利用模板的各像素值與估計區域的各像素值的差分值及MV值來算出。
再者,於編碼裝置及解碼裝置,於此所說明的處理的概要基本上是共通。
再者,不利用於此說明的處理本身,亦可利用其他處理,只要是可估計候補MV的周邊並導出最終的MV的處理均可。
於此,說明利用LIC處理來生成預測圖像的模式。
圖9D是用以說明利用LIC處理的亮度修正處理的預測圖像生成方法的概要的圖。
首先,從編碼完畢圖片之參考圖片,導出用以取得對應於編碼對象區塊的參考圖像的MV。
接著,對於編碼對象區塊,利用左鄰接及上鄰接的編碼完畢周邊參考區域的亮度像素值、及由MV指定的參考圖片內的同等位置的亮度像素值,擷取表示亮度值在參考圖片及編碼對象圖片如何變化的資訊,算出亮度修正參數。
對於由MV指定的參考圖片內的參考圖像,利用前述亮度修正參數進行亮度修正處理,藉此生成對於編碼對象區塊的預測圖像。
再者,圖9D的前述周邊參考區域的形狀為一例,亦可利用該形狀以外的形狀。
又,於此說明了從1張參考圖片生成預測圖像的處理,但從複數張參考圖片生成預測圖像的情況亦同樣如此,對從各個參考圖片取得的參考圖像,以同樣方法進行亮度修正處理後,生成預測圖像。
作為判定是否適用LIC處理的方法,包括例如利用表示是否適用LIC處理的訊號lic_flag的方法。具體例是於編碼裝置,判定編碼對象區塊是否屬於發生亮度變化的區域,屬於發生亮度變化的區域時,lic_flag設定值1,適用LIC處理而進行編碼,不屬於發生亮度變化的區域時,lic_flag設定值0,不適用LIC處理而進行編碼。另,於解碼裝置,藉由解碼串流所描述的lic_flag,因應其值來切換是否適用LIC處理而進行解碼。
作為判定是否適用LIC處理的方法,亦包括例如按照周邊區塊是否適用LIC處理來判定的方法。作為具體一例,編碼對象區塊為合併模式時,判定在合併處理的MV導出時所選擇的周邊的編碼完畢區塊,是否適用了LIC處理而編碼,因應其結果來切換是否適用LIC處理而進行編碼。再者,此例的情況下,解碼的處理亦完全同樣。
[解碼裝置的概要]
接著,說明可解碼從上述編碼裝置100輸出的編碼訊號(編碼位元串流)的解碼裝置的概要。圖10是表示實施形態1之解碼裝置200的功能構成之方塊圖。解碼裝置200是以區塊為單位解碼動態圖像/圖像的動態圖像/圖像解碼裝置。
如圖10所示,解碼裝置200具備熵解碼部202、反量化部204、反轉換部206、加算部208、區塊記憶體210、迴路濾波部212、幀記憶體214、幀內預測部216、幀間預測部218及預測控制部220。
解碼裝置200藉由例如通用處理器及記憶體來實現。此時,由處理器執行儲存於記憶體的軟體程式時,處理器是作為熵解碼部202、反量化部204、反轉換部206、加算部208、迴路濾波部212、幀內預測部216、幀間預測部218及預測控制部220發揮功能。又,解碼裝置200亦可作為對應於熵解碼部202、反量化部204、反轉換部206、加算部208、迴路濾波部212、幀內預測部216、幀間預測部218及預測控制部220的專用的1以上的電子電路來實現。
以下說明解碼裝置200所含的各構成要件。
[熵解碼部]
熵解碼部202將編碼位元串流予以熵解碼。具體而言,熵解碼部202例如從編碼位元串流算術解碼為二值訊號。然後,熵解碼部202將二值訊號予以多值化(debinarize)。藉此,熵解碼部202以區塊為單位,將量化係數輸出至反量化部204。
[反量化部]
反量化部204將來自熵解碼部202的輸入,即解碼對象區塊(以下稱為目前區塊)的量化係數,予以反量化。具體而言,反量化部204針對目前區塊的各個量化係數,根據對應於該量化係數的量化參數,將該量化係數予以反量化。然後,反量化部204將目前區塊之已被反量化的量化係數(亦即轉換係數),輸出至反轉換部206。
[反轉換部]
反轉換部206藉由將來自反量化部204的輸入即轉換係數,予以反轉換,來復原預測誤差。
例如表示從編碼位元串流解讀的資訊適用EMT或AMT時(例如AMT旗標為真),反轉換部206根據表示解讀的轉換類型的資訊,來將目前區塊的轉換係數予以反轉換。
又,例如表示從編碼位元串流解讀的資訊適用NSST時,反轉換部206對轉換係數適用反再轉換。
[加算部]
加算部208藉由加算從反轉換部206輸入的預測誤差與從預測控制部220輸入的預測樣本,來重構目前區塊。然後,加算部208將重構的區塊輸出至區塊記憶體210及迴路濾波部212。
[區塊記憶體]
區塊記憶體210是用以儲存幀內預測所參考的區塊,且為解碼對象圖片(以下稱為目前圖片)內的區塊的記憶部。具體而言,區塊記憶體210儲存從加算部208輸出的重構區塊。
[迴路濾波部]
迴路濾波部212對於由加算部208重構的區塊,施以迴路濾波器,將已濾波的重構區塊輸出至幀記憶體214及顯示裝置等。
表示從編碼位元串流解讀的ALF之開啟/關閉的資訊,表示ALF開啟時,根據局部梯度的方向及活性度而從複數個濾波器中選擇1個濾波器,選擇的濾波器適用於重構區塊。
[幀記憶體]
幀記憶體214是用以儲存幀間預測所用的參考圖片的記憶部,有時亦稱為幀緩衝器。具體而言,幀記憶體214儲存由迴路濾波部212所濾波的重構區塊。
[幀內預測部]
幀內預測部216根據從編碼位元串流解讀的幀內預測模式,參考儲存於區塊記憶體210的目前圖片內的區塊,來進行幀內預測,藉此生成預測訊號(幀內預測訊號)。具體而言,幀內預測部216參考鄰接於目前區塊的區塊的樣本(例如亮度值、色差值),來進行幀內預測,藉此生成幀內預測訊號,將幀內預測訊號輸出至預測控制部220。
再者,於色差區塊的幀內預測中,選擇參考亮度區塊的幀內預測模式時,幀內預測部216根據目前區塊的亮度成分,來預測目前區塊的色差成分亦可。
又,從編碼位元串流解讀的資訊表示適用PDPC時,幀內預測部216根據水平/垂直方向的參考像素的梯度,來修正幀內預測後的像素值。
[幀間預測部]
幀間預測部218參考儲存於幀記憶體214的參考圖片,預測目前區塊。預測是以目前區塊或目前區塊內的子區塊(例如4´4區塊)的單位進行。例如幀間預測部218利用從編碼位元串流解讀的移動資訊(例如移動向量),來進行移動補償,藉此生成目前區塊或子區塊的幀間預測訊號,並將幀間預測訊號輸出至預測控制部220。
再者,從編碼位元串流解讀的資訊表示適用OBMC模式時,幀間預測部218不僅可利用藉由移動估計所獲得的目前區塊的移動資訊,亦可利用鄰接區塊的移動資訊,來生成幀間預測訊號。
又,從編碼位元串流解讀的資訊表示適用FRUC模式時,幀間預測部218按照從編碼位元串流解讀的模式匹配的方法(雙向匹配或模板匹配),來進行移動估計,藉此導出移動資訊。然後,幀間預測部218利用導出的移動資訊來進行移動補償。
又,幀間預測部218在適用BIO模式時,根據假定等速直線運動的模型,來導出移動向量。又,從編碼位元串流解讀的資訊表示適用仿射移動補償預測模式時,幀間預測部218根據複數個鄰接區塊的移動向量,以子區塊為單位來導出移動向量。
[預測控制部]
預測控制部220選擇幀內預測訊號及幀間預測訊號的任一者,將選擇的訊號作為預測訊號而輸出至加算部208。
[第1態樣]
圖11是本態樣的編碼裝置100的編碼方法及編碼處理的流程圖。再者,本態樣的解碼裝置200的解碼方法及解碼處理是與編碼裝置100的編碼方法及編碼處理同樣。
編碼裝置100將處理對象的圖像區塊即對象區塊,分割為2個三角形劃分區即第1劃分區及第2劃分區(S111)。圖12A及圖12B是表示對象區塊的分割例的圖。例如如圖12A所示,編碼裝置100是以連結對象區塊的左上角及右下角的對角線作為邊界,將對象區塊分割為2個三角形劃分區。或,如圖12B所示,編碼裝置100是以連結對象區塊的右上角及左下角的對角線作為邊界,將對象區塊分割為2個三角形劃分區。例如第1劃分區及第2劃分區是依編碼順序來定義。或,第1劃分區及第2劃分區亦可依被編碼於位元串流內的順序來定義。
再者,第1劃分區及第2劃分區的一者為三角形劃分區亦可。又,亦可採用非矩形劃分區來取代三角形劃分區。非矩形劃分區包含三角形、梯形及多角形的劃分區。
接著,編碼裝置100生成第1劃分區用的第1候補移動向量清單(候補移動向量的第1集合)、及第2劃分區用的第2候補移動向量清單(候補移動向量的第2集合)(S112)。例如第1候補移動向量清單及第2候補移動向量清單亦可採用包含於對象區塊以外的區塊的鄰接劃分區的移動向量。
該鄰接劃分區為例如空間鄰接劃分區或時間鄰接劃分區。空間鄰接劃分區是指例如位於對象區塊的左方或上方的區塊,或包含於該等區塊的劃分區。又,空間鄰接劃分區亦可指位於對象區塊的左下、左上或右上的區塊,或包含於該等區塊的劃分區。又,時間鄰接劃分區是指包含於參考圖片的同位置(co-located)區塊,或包含於同位置區塊的劃分區。
例如第1候補移動向量清單與第2候補移動向量清單不同。例如第2候補移動向量清單不包含從第1候補移動向量清單選擇的移動向量。
例如第1候補移動向量清單包含鄰接於第1劃分區的劃分區的移動向量,第2候補移動向量清單包含鄰接於第2劃分區的劃分區的移動向量。
又,第1候補移動向量清單與第2候補移動向量清單亦可為同一清單。此情況下,例如從第1候補移動向量清單或第2候補移動向量清單,預測第1劃分區用的第1移動向量、及不同於第1移動向量的第2劃分區用的第2移動向量。
又,第1候補移動向量清單及第2候補移動向量清單的至少一者亦可與合併模式或幀間預測模式等預測模式用的對象區塊的第3候補移動向量清單為同一清單。
接著,編碼裝置100利用從第1候補移動向量清單預測的第1移動向量,於第1劃分區進行移動補償處理,利用從第2候補移動向量清單預測的第2移動向量,於第2劃分區進行移動補償處理(S113)。該處理包含從第1候補移動向量清單選擇第1移動向量的處理,及從第2候補移動向量清單選擇第2移動向量的處理。藉由利用第1劃分區的移動補償處理,來獲得第1劃分區的預測圖像,藉由利用第2劃分區的移動補償處理,來獲得第2劃分區的預測圖像。例如藉由第1劃分區及第2劃分區的移動補償處理所獲得的結果分別為三角形。又,藉由第1劃分區及第2劃分區的移動補償處理所獲得的結果亦可分別為矩形。
接著,編碼裝置100於對象區塊進行預測處理(S114)。具體而言,編碼裝置100合成第1劃分區的預測圖像及第2劃分區的預測圖像。該預測處理包含邊界平滑化處理,前述邊界平滑化處理是用以使第1劃分區與第2劃分區之間的邊界平滑。例如將根據第1劃分區的預測的邊界像素的第1值、與根據第2劃分區的預測的邊界像素的第2值進行加權。
具體而言,於預測處理中,編碼裝置100判定於第1劃分區與第2劃分區重複的重複區域的樣本數,設定對於重複的樣本的權重。例如該樣本數是在與分割方向正交的方向上,於第1劃分區與第2劃分區重複的樣本數。接著,編碼裝置100根據設定的權重,從第1劃分區及第2劃分區的移動補償處理的結果,生成對象區塊的預測區塊。
例如說明第1劃分區與第2劃分區重複的樣本數為4的情況。圖13A是表示重複的樣本例的圖。再者,於此將右上的劃分區設為第1劃分區,將左下的劃分區設為第2劃分區,但第1劃分區與第2劃分區相反亦可。重複區域的像素是利用第1劃分區的資訊及第2劃分區的資訊來預測。該資訊為例如移動向量或幀內預測方向。
例如第1劃分區的權重設定為1/8、1/4、3/4、7/8。又,第2劃分區的權重設定為7/8、3/4、1/4、1/8。又,將重複的樣本從第2劃分區側設為第1樣本、第2樣本、第3樣本、第4樣本。
此時,第1樣本之值是透過第1劃分區的第1樣本之值×1/8+第2劃分區的第1樣本之值×7/8來獲得。第2樣本之值是透過第1劃分區的第1樣本之值×1/4+第2劃分區的第1樣本之值×3/4來獲得。第3樣本之值是透過第1劃分區的第1樣本之值×3/4+第2劃分區的第1樣本之值×1/4來獲得。第4樣本之值是透過第1劃分區的第1樣本之值×7/8+第2劃分區的第1樣本之值×1/8來獲得。
圖13B是第1劃分區與第2劃分區的重複的樣本數最大為5時的重複區域的放大圖。如圖13B所示,重複區域的列及行最大分別包含5樣本。
圖13C是第1劃分區與第2劃分區的重複的樣本數最大為3時的重複區域的放大圖。如圖13C所示,重複區域的列及行最大分別包含3樣本。
再者,第1劃分區與第2劃分區重複的樣本數亦可為0。圖14是表示該情況下的對象區塊例的圖。又,重複的樣本數為1時,重複的樣本是透過第1劃分區的樣本值×1/2+第2劃分區的樣本值×1/2來獲得。
又,重複的樣本數為2時,將重複的樣本從第2劃分區側設為第1樣本、第2樣本。此時,第1樣本之值是透過第1劃分區的第1樣本之值×1/3+第2劃分區的第1樣本之值×2/3來獲得。第2樣本之值是透過第1劃分區的第1樣本之值×2/3+第2劃分區的第1樣本之值×1/3來獲得。
又,於此,敘述了第1劃分區與第2劃分區重複的像素數為整數之例,但重複的像素數為非整數(例如分數)亦可。又,亦可因應應用程式來切換權重。
接著,編碼裝置100進行利用1或複數個參數來編碼對象區塊的編碼處理(S115)。1或複數個參數包含以下之中至少一者:表示是否將對象區塊分割為包含非矩形劃分區(例如三角形劃分區)的複數個劃分區的資訊;將對象區塊分割為2個三角形的方向(以下亦稱為分割方向);第1劃分區及第2劃分區的移動向量;及預測處理的結果。
又,編碼裝置100亦可編碼第1劃分區及第2劃分區的移動向量之值,亦可編碼第1候補移動向量清單或第2候補移動向量清單的索引。例如編碼裝置100分開編碼將對象區塊分割為2個三角形的方向即分割方向、與第1劃分區及第2劃分區的移動向量。或,編碼裝置100將分割方向與第1劃分區及第2劃分區的移動向量一起編碼。
以下說明將分割方向與第1劃分區及第2劃分區的移動向量分開編碼的處理例。圖15是該處理的流程圖。首先,編碼裝置100編碼第1旗標,前述第1旗標表示對象區塊經分割後的2個劃分區為三角形(S121)。對象區塊經分割後的2個劃分區為三角形時,編碼裝置100編碼表示分割方向的第2旗標(S122)。接著,編碼裝置100編碼2個劃分區的2個移動向量(S123)。
再者,編碼裝置100亦可最先編碼第1旗標,接著編碼2個劃分區的2個移動向量,最後編碼第2旗標。
接著,說明將分割方向與第1劃分區及第2劃分區的移動向量一起編碼的處理例。圖16是該處理的流程圖。首先,編碼裝置100編碼第1旗標,前述第1旗標表示對象區塊經分割後的2個劃分區為三角形(S131)。對象區塊經分割後的2個劃分區為三角形時,編碼裝置100編碼第1索引,前述第1索引表示分割方向及2個劃分區的2個移動向量(S132)。於此,分割方向及2個劃分區的2個移動向量與第1索引被預先賦予對應。編碼裝置100藉由參考表示該對應關係的查找表,來導出對應於分割方向及2個劃分區的2個移動向量的第1索引。
圖17是該查找表例的圖。於圖17所示之例,第1索引值為0時,分割方向是從左上角往右下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第2移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第1移動向量預測。第1索引值為1時,分割方向是從右上角往左下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第1移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第2移動向量預測。第1索引值為2時,分割方向是從右上角往左下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第2移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第1移動向量預測。第1索引值為3時,分割方向是從左上角往右下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第2移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第2移動向量預測。第1索引值為4時,分割方向是從右上角往左下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第2移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第3移動向量預測。第1索引值為5時,分割方向是從左上角往右下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第3移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第1移動向量預測。第1索引值為6時,分割方向是從左上角往右下角的方向,第1劃分區的移動向量是從第1候補移動向量清單內的第4移動向量預測,第2劃分區的移動向量是從第2候補移動向量清單內的第1移動向量預測。
第1索引的二值化可採用固定長度二值化、截斷一元(truncated unary)二值化、截斷萊斯(truncated rice)二值化、指數格倫布(exp-golomb)二值化、及組合了截斷一元與指數格倫布的二值化之至少一者。圖18是表示第1索引的二值化例的圖。第1索引之值分為2個群組。小於4的第1索引之值被二值化而成為0及接續其後的截斷一元碼。4以上的第1索引之值被二值化而成為1及接續其後的指數格倫布碼。
圖19使表示將分割方向與第1劃分區及第2劃分區的移動向量一起編碼的處理的其他例的流程圖。編碼裝置100編碼第1索引,前述第1索引表示對象區塊經分割後的劃分區的形狀、分割方向、及2個劃分區的2個移動向量(S141)。該第1索引亦可進一步表示是否將對象區塊分割為2個劃分區。圖20是表示第1索引例的圖。於該例,第1索引之值為0時,對象區塊不被分割為三角形的2個劃分區。
再者,於解碼裝置200的處理中,進行將步驟S115等之「編碼」置換為「解碼」的處理。
[第1態樣的效果]
於本態樣,將三角形的劃分區導入幀間預測。比起矩形的劃分區,三角形的劃分區有時較符合對象物邊界。藉此,由於可改善對象物的預測精度,因此可提升編碼效率。
[第2態樣]
圖21是本態樣的編碼裝置100的編碼方法及編碼處理的流程圖。再者,本態樣的解碼裝置200的解碼方法及解碼處理是與編碼裝置100的編碼方法及編碼處理同樣。
編碼裝置100將處理對象的圖像區塊即對象區塊,分割為複數個劃分區(S151)。於此,複數個劃分區中至少1個劃分區為三角形的劃分區。圖22A、圖22B、圖22C及圖22D是表示對象區塊的分割例的圖。例如如圖22A所示,編碼裝置100將對象區塊分割為2個三角形劃分區。或,如圖22B所示,編碼裝置100將對象區塊分割為3個以上的三角形劃分區。或,如圖22C所示,複數個劃分區亦可包含三角形劃分區及矩形劃分區。或,如圖22D所示,複數個劃分區亦可包含三角形劃分區及多角形劃分區。
又,複數個劃分區包含第1劃分區及第2劃分區。例如第1劃分區為三角形劃分區。或,第2劃分區為三角形劃分區。例如第1劃分區及第2劃分區是依編碼順序來定義。或,第1劃分區及第2劃分區亦可依被編碼於位元串流內的順序來定義。
接著,編碼裝置100生成第1劃分區用的第1候補移動向量清單(候補移動向量的第1集合)、及第2劃分區用的第2候補移動向量清單(候補移動向量的第2集合)(S152)。例如第1候補移動向量清單及第2候補移動向量清單亦可採用包含於對象區塊以外的區塊的鄰接劃分區的移動向量。
該鄰接劃分區為例如空間鄰接劃分區或時間鄰接劃分區。空間鄰接劃分區是指例如位於對象區塊的左方或上方的區塊,或包含於該等區塊的劃分區。或,空間鄰接劃分區亦可指位於對象區塊的左下、左上或右上的區塊,或包含於該等區塊的劃分區。又,時間鄰接劃分區是指包含於參考圖片的同位置(co-located)區塊,或包含於同位置區塊的劃分區。
例如第1候補移動向量清單與第2候補移動向量清單不同。例如第2候補移動向量清單不包含從第1候補移動向量清單選擇的移動向量。
或,第1候補移動向量清單與第2候補移動向量清單亦可為同一清單。此情況下,例如從第1候補移動向量清單或第2候補移動向量清單,預測第1劃分區用的第1移動向量、及不同於第1移動向量的第2劃分區用的第2移動向量。
或,第1候補移動向量清單及第2候補移動向量清單的至少一者亦可與合併模式或幀間預測模式等預測模式用的對象區塊的第3候補移動向量清單為同一清單。
又,鄰接劃分區亦可為空間鄰接劃分區及時間鄰接劃分區的至少一者。
接著,編碼裝置100利用從第1候補移動向量清單預測的移動向量,於第1劃分區進行移動補償處理,利用從第2候補移動向量清單預測的移動向量,於第2劃分區進行移動補償處理(S153)。例如藉由第1劃分區及第2劃分區的移動補償處理所獲得的結果分別為三角形。或,藉由第1劃分區及第2劃分區的移動補償處理所獲得的結果亦可分別為矩形。
接著,編碼裝置100對對象區塊進行預測處理(S154)。編碼裝置100於預測處理中,判定於第1劃分區與第2劃分區重複的樣本數,設定對於重複的樣本的權重。接著,編碼裝置100根據設定的權重,從第1劃分區及第2劃分區的移動補償處理的結果,生成對象區塊的預測區塊。
再者,該處理的詳細與圖14所示的第1態樣同樣。
接著,編碼裝置100進行編碼處理,其根據第1劃分區及第2劃分區的移動向量及預測處理的結果,來編碼對象區塊(S155)。又,編碼裝置100亦可編碼第1劃分區及第2劃分區的移動向量之值,亦可編碼第1候補移動向量清單或第2候補移動向量清單的索引。
圖23是對象區塊的編碼處理的流程圖。首先,編碼裝置100編碼第1旗標,前述第1旗標表示對象區塊被分割為包含第1劃分區及第2劃分區的複數個劃分區(S161)。複數個劃分區的至少1個為三角形時,編碼裝置100編碼第1劃分區及第2劃分區的2個移動向量(S162)。
再者,於解碼裝置200的處理中,進行將步驟S155等之「編碼」置換為「解碼」的處理。
[第2態樣的效果]
於本態樣,將劃分區的適宜的分割方法導入幀間預測。對象區塊被分割為包含三角形或非矩形的複數個劃分區。比起矩形的劃分區,三角形的劃分區及非矩形的劃分區有時較符合對象物邊界。藉此,由於可改善對象物的移動的預測精度,因此可提升編碼效率。
[第3態樣]
圖24是本態樣的編碼裝置100的編碼方法及編碼處理的流程圖。再者,本態樣的解碼裝置200的解碼方法及解碼處理是與編碼裝置100的編碼方法及編碼處理同樣。
首先,編碼裝置100將處理對象的圖像區塊即對象區塊,分割為複數個劃分區(S171)。於此,複數個劃分區包含三角形的劃分區的第1劃分區。
接著,編碼裝置100進行對於第1劃分區的第1樣本集的預測處理(S172)。接著,編碼裝置100從鄰接劃分區的移動向量預測移動向量。編碼裝置100利用預測的移動向量,對於鄰接於第1劃分區的斜邊且包含於與第1樣本集重複的第1劃分區內的區域的第2樣本集,進行幀間預測處理(S173)。
該鄰接劃分區為例如空間鄰接劃分區或時間鄰接劃分區。空間鄰接劃分區是指例如位於對象區塊的左方或上方的區塊,或包含於該等區塊的劃分區。或,空間鄰接劃分區亦可指位於對象區塊的左下、左上或右上的區塊,或包含於該等區塊的劃分區。又,時間鄰接劃分區是指包含於參考圖片的同位置(co-located)區塊,或包含於同位置區塊的劃分區。
圖25是表示第1劃分區的第1樣本集及第2樣本集之例的圖。例如第1劃分區的第1樣本集包含第1劃分區所含的所有樣本。第1劃分區的第2樣本集是鄰接於第1劃分區的斜邊的第1劃分區內的樣本。換言之,第1劃分區的第2樣本集是從第1劃分區的斜邊起1樣本以內的距離所含的樣本。
例如編碼裝置100對於第1樣本集進行幀內預測處理。接著,編碼裝置100對於第2樣本集,進行利用移動向量的幀間預測處理。
或,編碼裝置100對於第1樣本集進行幀間預測處理。接著,編碼裝置100對於第2樣本集,進行利用移動向量的幀間預測處理。
於此,對於第1樣本集或第2樣本集的預測處理所用的資訊為移動向量或幀內預測方向等。
接著,編碼裝置100利用第1樣本集及第2樣本集,對於第1劃分區的重複區域進行加權處理(S174)。接著,編碼裝置100利用加權處理後的樣本來編碼第1劃分區(S175)。
再者,於解碼裝置200的處理中,進行將步驟S175等之「編碼」置換為「解碼」的處理。
[第3態樣的效果]
於本態樣,將劃分區的適宜的分割方法導入幀間預測。對象區塊被分割為包含三角形或非矩形的複數個劃分區。比起矩形的劃分區,三角形的劃分區及非矩形的劃分區有時較符合對象物邊界。藉此,由於可改善對象物的移動的預測精度,因此可提升編碼效率。
再者,於上述態樣的任一態樣,幀間預測部是從候補移動向量的第1集合,選擇第1候補移動向量,將第1候補移動向量與第1移動向量的差分加在第1候補移動向量,藉此導出第1移動向量。幀間預測部是從候補移動向量的第2集合,選擇第2候補移動向量,將第2候補移動向量與第2移動向量的差分加在第2候補移動向量,藉此導出第2移動向量。
又,於幀間預測中,亦可進行下述處理。候補移動向量的第1集合所含的所有候補移動向量亦可為單向預測(uni-prediction)移動向量。總言之,幀間預測部亦可將候補移動向量的第1集合內的複數個候補移動向量,僅設定為單向預測移動向量。或,幀間預測部亦可從候補移動向量的第1集合,僅選擇單向預測的候補移動向量。
單向預測移動向量是利用於尺寸小的區塊的預測。雙向預測(bi-prediction)移動向量是利用於尺寸大的區塊的預測。例如預測處理包含判定對象區塊的尺寸的處理。對象區塊的尺寸大於預先決定的閾值時,於預測處理中,從包含單向預測移動向量及/或雙向預測移動向量的候補移動向量的第1集合,選擇第1移動向量。於此,對象區塊的尺寸小於預先決定的閾值時,於預測處理中,從僅包含雙向預測移動向量的候補移動向量的第1集合,選擇第1移動向量。
[第4態樣]
圖26是表示利用三角形旗標(Triangle-Flag)的算術編碼處理中的上下文(Context)切換方法例的流程圖,前述三角形旗標是表示是否進行三角形(Triangle)預測的資訊。
再者,上下文是於某特定的語法(Syntax)的算術編碼(例如CABAC)處理中,在一面因應條件切換複數個機率表,一面進行處理時,用以識別要使用複數個機率表的何者的資訊。
又,三角形預測是於第1態樣至第3態樣所說明的處理,是將對象區塊分割為三角形或非矩形的劃分區,於各劃分區進行預測處理的處理。
首先,編碼裝置100取得周邊區塊的三角形旗標(S201)。接著,編碼裝置100因應周邊區塊的三角形旗標,切換用於對象區塊的算術編碼的上下文(S202~S204)。
圖27是表示具體的上下文切換條件例的圖。如圖27所示,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標均為0(亦即不進行三角形預測)時,利用上下文號碼0的上下文進行算術編碼處理。
又,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標的一者為1(亦即進行三角形預測),另一者為0(亦即不進行三角形預測)時,利用上下文號碼1的上下文進行算術編碼處理。又,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標均為1(亦即進行三角形預測)時,利用上下文號碼2的上下文進行算術編碼處理。
[第4態樣的效果]
若依據第4態樣的構成,可能可藉由依條件進行上下文的切換,來提升編碼效率。
再者,於解碼裝置200的算術解碼處理中,亦可進行與上述編碼裝置100的算術編碼處理同樣的處理。
又,並非總是需要第4態樣所記載的所有處理,亦可僅進行第4態樣所記載的一部分處理。
[第5態樣]
圖28是表示利用三角形旗標之,三角形旗標的算術編碼處理中的上下文切換方法例的流程圖,前述三角形旗標是表示是否進行三角形預測的資訊。
首先,編碼裝置100取得周邊區塊的三角形旗標(S211)。接著,編碼裝置100因應周邊區塊的三角形旗標,切換用於對象區塊之三角形旗標的算術編碼的上下文(S212~S214)。
圖29是表示具體的上下文切換條件例的圖。例如如圖29所示,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標均為0(亦即不進行三角形預測)時,利用上下文號碼0的上下文進行三角形旗標的算術編碼處理。
又,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標的一者為1(亦即進行三角形預測),另一者為0(亦即不進行三角形預測)時,利用上下文號碼1的上下文進行算術編碼處理。又,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標均為1(亦即進行三角形預測)時,利用上下文號碼2的上下文進行三角形旗標的算術編碼處理。
又,周邊區塊不是左鄰接區塊及上鄰接區塊亦可。例如周邊區塊包含對象區塊的左上鄰接區塊、右上鄰接區塊及左下鄰接區塊等,對於對象區塊存在於斜向位置的區塊中之至少1個亦可。
圖30是表示該情況下的上下文切換條件例的圖。如圖30所示,編碼裝置100是於對象區塊的左上區塊的三角形旗標為1,且右上區塊的三角形旗標為0時,利用上下文號碼0的上下文進行三角形旗標的算術編碼處理。又,編碼裝置100是於對象區塊的右上區塊的三角形旗標為1,且左上區塊的三角形旗標為0時,利用上下文號碼1的上下文進行三角形旗標的算術編碼處理。又,編碼裝置100是於對象區塊的左上區塊及右上區塊的三角形旗標均為1時,利用上下文號碼2的上下文進行三角形旗標的算術編碼處理。
如圖31所示,考慮橢圓類物體運動的情況。又,區塊4是利用右上對角線進行三角形預測。若假定斜線經常繼續,則視為區塊6很可能亦採用三角形預測。藉由利用這樣的相關關係來切換上下文,編碼性能可能提升。
又,編碼裝置100亦可將周邊區塊的三角形旗標與其他資訊組合來使用,以切換用於三角形旗標的算術編碼的上下文。例如編碼裝置100亦可因應周邊區塊的三角形旗標,並且因應對象區塊的區塊分割階層及縱橫的寬高比、以及周邊區塊的區塊分割階層及縱橫的寬高比的至少1個以上,來切換上下文。又,周邊區塊不是左鄰接及上鄰接區塊亦可。例如對象區塊的左上鄰接、右上鄰接、左下鄰接的區塊的至少1個亦可。
[第5態樣的效果]
若依據第5態樣的構成,因應周邊區塊是否採用三角形預測,來切換對象區塊的三角形旗標的上下文。於此,周邊區塊是否進行三角形預測,很有可能與對象區塊進行三角形預測的機率相關。故,藉由本態樣的手法,可能可提升編碼效率。
再者,於解碼裝置200的算術解碼處理中,亦可進行與上述編碼裝置100的算術編碼處理同樣的處理。
又,並非總是需要第5態樣所記載的所有處理,亦可僅進行第5態樣所記載的一部分處理。
再者,編碼裝置100亦可因應區塊的分割形狀,變更利用三角形旗標的上下文切換方法。具體而言,周邊區塊進行三角形預測,利用該三角形預測所分割的三角形的斜邊的延長線是否包含於對象區塊,來進行上下文的切換。
圖32是表示區塊的一例的圖。圖33是表示該情況下的上下文切換條件例的圖。如圖33所示,編碼裝置100亦可因應周邊區塊進行三角形預測,且其三角形預測所分割的三角形的斜邊的延長線是否包含於對象區塊,來進行上下文的切換。圖32的區塊7為對象區塊時,例如編碼裝置100根據左上的區塊1及右上的區塊4的三角形的斜邊的延長線是否包含於對象區塊,來切換上下文。具體而言,區塊1的分割方向是從右上往左下時,以及區塊4的分割方向是從左上往右下時,選擇上下文號碼0的上下文。
又,編碼裝置100依據上面所述的各種條件,不是切換上下文,而是切換進行上下文切換或利用旁路(bypass)方式等進行編碼。
[第6態樣]
圖34是表示利用三角形旗標的區塊分割資訊的算術編碼處理中的上下文切換方法例的流程圖,前述三角形旗標是表示是否進行三角形預測的資訊。
首先,編碼裝置100取得周邊區塊的三角形旗標(S221)。接著,編碼裝置100因應周邊區塊的三角形旗標,切換對象區塊的區塊分割資訊的上下文(S222~S224)。
圖35是表示具體的上下文切換條件例的圖。如圖35所示,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標均為0(亦即不進行三角形預測)時,利用上下文號碼0的上下文進行區塊分割資訊的算術編碼處理。
又,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標的一者為1(亦即進行三角形預測),另一者為0(亦即不進行三角形預測)時,利用上下文號碼1的上下文進行區塊分割資訊的算術編碼處理。又,編碼裝置100是於對象區塊的左區塊及上區塊的三角形旗標均為1(亦即進行三角形預測)時,利用上下文號碼2的上下文進行區塊分割資訊的算術編碼處理。
於此,區塊分割資訊包含例如指定區塊分割數的資訊、及表示區塊分割方向的資訊的至少一者。再者,區塊分割資訊亦可包含表示是否進一步分割區塊的資訊。又,編碼裝置100亦可將周邊區塊的三角形旗標與其他資訊組合來使用,以切換用於區塊分割資訊的算術編碼的上下文。例如編碼裝置100亦可因應周邊區塊的三角形旗標,並且因應對象區塊的區塊分割階層及縱橫的寬高比、以及周邊區塊的區塊分割階層及縱橫的寬高比的至少1個以上,來進行上下文的切換。又,周邊區塊不是左鄰接及上鄰接區塊亦可。例如周邊區塊包含對象區塊的左上鄰接區塊、右上鄰接區塊及左下鄰接區塊的至少1個亦可。
[第6態樣的效果]
若依據第6態樣的構成,因應在周邊區塊是否採用三角形預測,來切換對象區塊的區塊分割資訊的上下文。於此,周邊區塊是否進行三角形預測,很有可能與對象區塊的分割形狀相關。故,藉由本態樣的手法,可能可提升編碼效率。
再者,於解碼裝置200的算術解碼處理中,亦可進行與上述編碼裝置100的算術編碼處理同樣的處理。
又,並非總是需要第6態樣所記載的所有處理,亦可僅進行第6態樣所記載的一部分處理。
[變形例]
三角形旗標亦可表示是否進行三角形預測以外的資訊。例如亦可利用圖20等所示的第1索引來取代三角形旗標。進而言之,亦可利用與圖20所示的第1索引相對應的1個以上的資訊(劃分區的形狀、分割方向及劃分區的移動向量)的至少1個,來取代三角形旗標。
又,亦可將上述各態樣所說明的三角形劃分區,置換為非矩形劃分區。圖36A、圖36B、圖36C及圖36D是表示非矩形劃分區例的圖。非矩形劃分區亦可如圖36A所示為L字形劃分區。又,非矩形劃分區亦可如圖36B所示為五角形劃分區。又,非矩形劃分區亦可如圖36C所示為六角形劃分區。又,非矩形劃分區亦可如圖36D所示為多角形劃分區。
又,對象區塊亦可被分割為非矩形或矩形的複數個劃分區。於此,複數個劃分區的至少1個為非矩形劃分區。又,非矩形劃分區不限定於圖36A~圖36D所示之例。又,亦可任意組合圖36A~圖36D。
又,上述劃分區亦可為預測單位(prediction unit)或預測單位經分割後的子預測單位。
又,上述第1旗標及第2旗標為單一旗標或不同旗標均可。
又,編碼裝置100亦可根據以下所示的第1參數來決定第2參數。圖37是表示第1參數及第2參數的處理例的圖。
例如第1參數是區塊尺寸,第2參數是表示藉由分割對象區塊所得的複數個劃分區的至少1個是否為三角形劃分區的旗標(三角形旗標)。例如編碼裝置100在區塊尺寸大於預先決定的尺寸(例如64×64)時,不採用三角形劃分區。或,編碼裝置100在對象區塊的寬度與高度的比大於預先決定的比(例如4)時,不採用三角形劃分區。寬度與高度的比大於4的區塊是指例如64×4的區塊等。
例如第1參數是預測模式,第2參數是三角形旗標。例如編碼裝置100是於在對象區塊適用幀內預測模式時,不採用三角形劃分區。
例如第1參數是三角形旗標,第2參數是預測模式。例如編碼裝置100是於藉由分割對象區塊所得的複數個劃分區的至少1個為三角形劃分區時,於對象區塊適用幀間預測。
例如第1參數是鄰接區塊的移動向量,第2參數是將對象區塊分割為2個三角形劃分區的方向(分割方向)。例如編碼裝置100在鄰接區塊的移動向量的方向為對角線方向(例如連結左上角與右下角的方向)時,將分割方向設定為連結左上角與右下角的方向。總言之,編碼裝置100將分割方向設定為與鄰接區塊的移動向量的方向相同或類似的方向。
例如第1參數是鄰接區塊的幀內預測方向,第2參數是將對象區塊分割為2個三角形劃分區的方向(分割方向)。例如編碼裝置100在鄰接區塊的幀內預測方向為反對角線方向(例如連結右上角與左下角的方向)時,將分割方向設定為連結右上角與左下角的方向。總言之,編碼裝置100將分割方向設定為與鄰接區塊的幀內預測方向相同或類似的方向。
再者,於此雖表示編碼裝置100的動作例,但於解碼裝置200亦可進行同樣的處理。
如以上,本實施形態的編碼裝置100進行以下處理。圖38是表示本實施形態的編碼裝置100的編碼處理的流程圖。
首先,編碼裝置100對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,就各劃分區進行預測處理(S301)。總言之,編碼裝置100對於複數個區塊的各個區塊,選擇性地適用非矩形預測及不是非矩形預測的一般預測的任一者。例如非矩形劃分區為三角形劃分區。再者,非矩形劃分區亦可為圖36A~圖36D所示的非矩形劃分區。
接著,編碼裝置100利用與周邊區塊的非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文(S302)。然後,編碼裝置100利用決定的上下文,將第1資訊進行算術編碼。
例如與周邊區塊的非矩形預測相關的第2資訊,是表示是否對周邊區塊適用非矩形預測的資訊(例如三角形旗標)。
又,有關對象區塊的第1資訊,亦可是與對象區塊的非矩形預測相關的第2資訊。總言之,編碼裝置100亦可利用與周邊區塊的非矩形預測相關的第2資訊,來決定用於有關對象區塊的第2資訊的算術編碼的上下文。換言之,編碼裝置100亦可與使用決定的上下文的參數同樣利用周邊區塊的參數,來決定該上下文。
又,有關對象區塊的第1資訊,是表示是否於對象區塊適用非矩形預測的資訊(例如三角形旗標)。
又,有關對象區塊的第1資訊,亦可是與表示是否於對象區塊適用非矩形預測的資訊相對應的資訊。例如該資訊亦可為圖20所示的第1索引。有關對象區塊的第1資訊亦可包含與圖20所示的第1索引相對應的複數種資訊(表示是否適用非矩形預測的資訊、分割方向及劃分區的移動向量)中之至少一種。
又,有關與周邊區塊的非矩形預測相關的第2資訊,亦可是與表示是否於周邊區塊適用非矩形預測的資訊相對應的資訊。例如該資訊亦可為圖20所示的第1索引。有關對象區塊的第1資訊亦可包含與圖20所示的第1索引相對應的複數種資訊(表示是否適用非矩形預測的資訊、分割方向及劃分區的移動向量)中之至少一種。
或,有關對象區塊的第1資訊是有關對象區塊的分割的資訊(例如區塊分割資訊)。
或,與周邊區塊的非矩形預測相關的第1資訊,亦可是表示周邊區塊經分割後的三角形劃分區的斜邊是否包含於對象區塊的資訊。
又,周邊區塊亦可為對象區塊的上鄰接區塊、左鄰接區塊、左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。例如周邊區塊為對象區塊的上鄰接區塊或左鄰接區塊。或,周邊區塊為對象區塊的左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。
又,於上下文的決定中,編碼裝置100亦可進一步利用對象區塊或周邊區塊的區塊分割階層,來決定上下文。
又,於上下文的決定中,編碼裝置100亦可進一步利用對象區塊或周邊區塊的寬高比,來決定上下文。
又,本實施形態的解碼裝置200進行以下處理。圖39是表示本實施形態的解碼裝置200的解碼處理的流程圖。
首先,解碼裝置200對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,就各劃分區進行預測處理(S311)。總言之,解碼裝置200對於複數個區塊的各個區塊,選擇性地適用非矩形預測及不是非矩形預測的一般預測的任一者。例如非矩形劃分區為三角形劃分區。再者,非矩形劃分區亦可為圖36A~圖36D所示的非矩形劃分區。
接著,解碼裝置200利用與周邊區塊的非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文(S312)。然後,解碼裝置200利用決定的上下文,將第1資訊進行算術解碼。
例如與周邊區塊的非矩形預測相關的第2資訊,是表示是否對周邊區塊適用非矩形預測的資訊(例如三角形旗標)。
又,有關對象區塊的第1資訊,亦可是與對象區塊的非矩形預測相關的第2資訊。總言之,解碼裝置200亦可利用與周邊區塊的非矩形預測相關的第2資訊,來決定用於有關對象區塊的第2資訊的算術編碼的上下文。換言之,解碼裝置200亦可與使用決定的上下文的參數同樣利用周邊區塊的參數,來決定該上下文。
又,有關對象區塊的第1資訊,是表示是否於對象區塊適用非矩形預測的資訊(例如三角形旗標)。
又,有關對象區塊的第1資訊,亦可是與表示是否於對象區塊適用非矩形預測的資訊相對應的資訊。例如該資訊亦可為圖20所示的第1索引。有關對象區塊的第1資訊亦可包含與圖20所示的第1索引相對應的複數種資訊(表示是否適用非矩形預測的資訊、分割方向及劃分區的移動向量)中之至少一種。
又,有關與周邊區塊的非矩形預測相關的第2資訊,亦可是與表示是否於周邊區塊適用非矩形預測的資訊相對應的資訊。例如該資訊亦可為圖20所示的第1索引。有關對象區塊的第1資訊亦可包含與圖20所示的第1索引相對應的複數種資訊(表示是否適用非矩形預測的資訊、分割方向及劃分區的移動向量)中之至少一種。
或,有關對象區塊的第1資訊是有關對象區塊的分割的資訊(例如區塊分割資訊)。
或,與周邊區塊的非矩形預測相關的第1資訊,亦可是表示周邊區塊經分割後的三角形劃分區的斜邊是否包含於對象區塊的資訊。
又,周邊區塊亦可為對象區塊的上鄰接區塊、左鄰接區塊、左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。例如周邊區塊為對象區塊的上鄰接區塊或左鄰接區塊。或,周邊區塊為對象區塊的左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。
又,於上下文的決定中,解碼裝置200亦可進一步利用對象區塊或周邊區塊的區塊分割階層,來決定上下文。
又,於上下文的決定中,解碼裝置200亦可進一步利用對象區塊或周邊區塊的寬高比,來決定上下文。
又,本實施形態的編碼裝置100具備:分割部102,將圖像分割為複數個區塊;幀內預測部124,利用包含於前述圖像的參考圖片,來預測包含於前述圖像的區塊;幀間預測部126,利用包含於與前述圖像不同的其他圖像的參考區塊,來預測包含於前述圖像的區塊;迴路濾波部120,對包含於前述圖像的區塊適用濾波器;轉換部106,轉換由前述幀內預測部124或前述幀間預測部126所生成的預測訊號與原訊號的預測誤差,生成轉換係數;量化部108,量化前述轉換係數,生成量化係數;及熵編碼部110,藉由將前述量化係數進行可變長度編碼,生成編碼位元串流。幀內預測部124或幀間預測部126對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,就各劃分區進行預測處理(S301)。熵編碼部110利用與周邊區塊的非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文(S302)。
又,本實施形態的解碼裝置200具備:解碼部(熵解碼部202),解碼編碼位元串流,輸出量化係數;反量化部204,將前述量化係數予以反量化,輸出轉換係數;反轉換部206,將前述轉換係數予以反轉換,輸出預測誤差;幀內預測部216,利用包含於圖像的參考圖片,來預測包含於前述圖像的區塊;幀間預測部218,利用包含於與前述圖像不同的其他圖像的參考區塊,來預測包含於前述圖像的區塊;及迴路濾波部212,對包含於前述圖像的區塊適用濾波器。幀內預測部216或幀間預測部218對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,就各劃分區進行預測處理(S311)。熵解碼部202利用與周邊區塊的非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文(S312)。
[編碼裝置的實作例]
圖40是表示實施形態1的編碼裝置100的實作例的方塊圖。編碼裝置100具備電路160及記憶體162。例如圖1所示的編碼裝置100的複數個構成要件,是藉由圖40所示的電路160及記憶體162來實作。
電路160是進行資訊處理的電路,且是可對記憶體162進行存取的電路。例如電路160是編碼動態圖像的專用或通用的電子電路。電路160可為如CPU的處理器。又,電路160亦可為複數個電子電路的集合體。又,例如電路160亦可發揮圖1等所示的編碼裝置100的複數個構成要件中,用以記憶資訊的構成要件除外的複數個構成要件的作用。
記憶體162是記憶電路160用以編碼動態圖像的資訊之通用或專用的記憶體。記憶體162為電子電路或連接於電路160均可。又,記憶體162亦可包含於電路160。又,記憶體162亦可為複數個電子電路的集合體。又,記憶體162亦可為磁碟片或光碟片等,或亦可表現為儲存器或記錄媒體等。又,記憶體162為非揮發性記憶體或揮發性記憶體均可。
例如於記憶體162,記憶編碼的動態圖像,或記憶對應於經編碼的動態圖像的位元串均可。又,於記憶體162,亦可記憶電路160用以編碼動態圖像的程式。
又,例如記憶體162亦可發揮圖1等所示的編碼裝置100的複數個構成要件中,用以記憶資訊的構成要件的作用。具體而言,記憶體162亦可發揮圖1所示的區塊記憶體118及幀記憶體122的作用。更具體而言,於記憶體162,亦可記憶重構完畢的區塊及重構完畢的圖片等。
再者,於編碼裝置100,亦可不實作圖1等所示複數個構成要件的全部,亦可不進行上述複數種處理的全部。圖1等所示的複數個構成要件的一部分,亦可包含於其他裝置,亦可由其他裝置來執行上述複數種處理的一部分。
[解碼裝置的實作例]
圖41是表示實施形態1的解碼裝置200的實作例的方塊圖。解碼裝置200具備電路260及記憶體262。例如圖10所示的解碼裝置200的複數個構成要件,是藉由圖41所示的電路260及記憶體262來實作。
電路260是進行資訊處理的電路,且是可對記憶體262進行存取的電路。例如電路260是解碼動態圖像的專用或通用的電子電路。電路260可為如CPU的處理器。又,電路260亦可為複數個電子電路的集合體。又,例如電路260亦可發揮圖10等所示的解碼裝置200的複數個構成要件中,用以記憶資訊的構成要件除外的複數個構成要件的作用。
記憶體262是記憶電路260用以解碼動態圖像的資訊之專用或通用的記憶體。記憶體262為電子電路或連接於電路260均可。又,記憶體262亦可包含於電路260。又,記憶體262亦可為複數個電子電路的集合體。又,記憶體262亦可為磁碟片或光碟片等,亦可表現為儲存器或記錄媒體等。又,記憶體262為非揮發性記憶體或揮發性記憶體均可。
例如於記憶體262,亦可記憶對應於經編碼的動態圖像的位元串,亦可記憶對應於經解碼的位元串的動態圖像。又,於記憶體262,亦可記憶電路260用以編碼動態圖像的程式。
又,例如記憶體262亦可發揮圖10等所示的解碼裝置200的複數個構成要件中,用以記憶資訊的構成要件的作用。具體而言,記憶體262亦可發揮圖10所示的區塊記憶體210及幀記憶體214的作用。更具體而言,於記憶體262,亦可記憶重構完畢的區塊及重構完畢的圖片等。
再者,於解碼裝置200,亦可不實作圖10等所示複數個構成要件的全部,亦可不進行上述複數種處理的全部。圖10等所示的複數個構成要件的一部分亦可包含於其他裝置,亦可由其他裝置來執行上述複數種處理的一部分。
[補充]
又,本實施形態的編碼裝置100及解碼裝置200亦可分別作為圖像編碼裝置及圖像解碼裝置來利用,亦可分別作為動態圖像編碼裝置及動態圖像解碼裝置來利用。
又,於本實施形態,各構成要件亦可由專用的硬體來構成,或藉由執行適於各構成要件的軟體程式來實現。各構成要件亦可由CPU或處理器等之程式執行部,讀出並執行記錄在硬碟或半導體記憶體等記錄媒體的軟體程式來實現。
具體而言,編碼裝置100及解碼裝置200亦可分別具備:處理電路(Processing Circuitry);及記憶裝置(Storage),電連接於該處理電路,且可由該處理電路進行存取。例如處理電路對應於電路160或260,記憶裝置對應於記憶體162或262。
處理電路包含專用的硬體及程式執行部的至少一方,且利用記憶裝置來執行處理。又,在處理電路包含程式執行部時,記憶裝置記憶由該程式執行部所執行的軟體程式。
於此,實現本實施形態的編碼裝置100或解碼裝置200等之軟體是如下程式。
又,如上述,各構成要件亦可為電路。該等電路亦可作為全體構成1個電路,亦可各自為不同電路。又,各構成要件亦可以通用處理器來實現,亦可以專用處理器來實現。
又,亦可由其他構成要件來執行特定構成要件所執行的處理。又,亦可變更執行處理的順序,亦可複數種處理同時進行。又,編碼解碼裝置亦可具備編碼裝置100及解碼裝置200。
以上根據實施形態,說明了編碼裝置100及解碼裝置200的態樣,但編碼裝置100及解碼裝置200的態樣不限定於該實施形態。只要不脫離本發明之旨趣,熟悉該技藝人士所想到的各種變形施行於實施形態、或組合不同實施形態的構成要件予以建構的形態,亦可包含於編碼裝置100及解碼裝置200的態樣的範圍內。
亦可將本態樣,與本發明的其他態樣的至少一部分組合而實施。又,亦可將本態樣的流程圖所記載的一部分處理、裝置的一部分構成、語法的一部分等,與其他態樣組合而實施。
(實施形態2)
於以上各實施形態,功能方塊的各個一般可藉由MPU及記憶體等來實現。又,功能方塊的各個的處理一般藉由處理器等之程式執行部,讀出並執行記錄於ROM等記錄媒體的軟體(程式)來實現。該軟體藉由下載等來分發,或記錄於半導體記憶體等記錄媒體來分發均可。再者,當然亦可藉由硬體(專用電路)各功能方塊來實現各功能方塊。
又,於各實施形態所說明的處理藉由利用單一裝置(系統)集中處理,或利用複數個裝置分散處理來實現均可。又,執行上述程式的處理器為單一數目或複數個均可。亦即,集中處理或分散處理均可。
本發明的態樣不限定於以上實施形態,可予以各種變更,該等變更亦包含於本發明的範圍內。
進一步在此說明上述各實施形態所示之動態圖像編碼方法(圖像編碼方法)或動態圖像解碼方法(圖像解碼方法)之應用例、與利用其之系統。該系統的特徵在於具有利用圖像編碼方法的圖像編碼裝置、利用圖像解碼方法的圖像解碼裝置、及具備雙方的圖像編碼解碼裝置。關於系統的其他構成,可因應情況適當地變更。
[使用例]
圖42是表示實現內容發布服務之內容供給系統ex100的全體構成圖。將通訊服務之提供區分割為所需大小,於各巢(cell)內分別設置固定無線台即基地局ex106、ex107、ex108、ex109、ex110。
於該內容供給系統ex100,經由網際網路服務提供者ex102或通訊網ex104、及基地局ex106~ex110,將電腦ex111、遊戲機ex112、攝影機ex113、家電ex114及智慧型手機ex115等各機器,連接於網際網路ex101。該內容供給系統ex100亦可組合上述任一要件而連接。不經由固定無線台即基地局ex106~ex110,各機器經由電話網或近距離無線等而直接或間接地相互連接亦可。又,串流化伺服器ex103經由網際網路ex101等來與電腦ex111、遊戲機ex112、攝影機ex113、家電ex114及智慧型手機ex115等各機器連接。又,串流化伺服器ex103經由衛星ex116來與飛機ex117內的熱點內的終端裝置等連接。
再者,亦可利用無線存取點或熱點等,來取代基地局ex106~ex110。又,串流化伺服器ex103不經由網際網路ex101或網際網路服務提供者ex102而直接與通訊網ex104連接,或不經由衛星ex116而直接與飛機ex117連接均可。
攝影機ex113是數位攝影機等可拍攝靜止圖及動畫的機器。又,智慧型手機ex115是一般支援2G、3G、3.9G、4G,以及今後稱為5G的移動通訊系統方式的智慧型機、行動電話或PHS(Personal Handyphone System(個人手持電話系統))等。
家電ex118為冰箱或家庭用燃料電池汽電共生系統所含的機器等。
於內容供給系統ex100,具有攝影功能的終端裝置藉由透過基地局ex106等,連接於串流化伺服器ex103,可實現實況發布等。於實況發布,終端裝置(電腦ex111、遊戲機ex112、攝影機ex113、家電ex114、智慧型手機ex115及飛機ex117內的終端裝置等)對於使用者利用該終端裝置所拍攝的靜止圖或動畫內容,進行上述各實施形態所說明的編碼處理,將藉由編碼所獲得的影像資料、及對應於影像的聲音經編碼的聲音資料,予以多工,將獲得的資料發送至串流化伺服器ex103。亦即,各終端裝置作為本發明一態樣的圖像編碼裝置而發揮功能。
另,串流化伺服器ex103將對於有需求的客戶所發送內容資料,進行串流發布。客戶是可將上述經編碼處理的資料解碼的電腦ex111、遊戲機ex112、攝影機ex113、家電ex114、智慧型手機ex115及飛機ex117內的終端裝置等。接收到發布資料的各機器將接收資料予以解碼處理並播放。亦即,各機器作為本發明一態樣的圖像解碼裝置而發揮功能。
[分散處理]
又,串流化伺服器ex103亦可為複數台伺服器或複數台電腦,分散處理、記錄或發布資料。例如串流化伺服器ex103亦可藉由CDN(Contents Delivery Network(內容發布網路))來實現,藉由連結分散在全世界的許多邊緣伺服器與邊緣伺服器間的網路,來實現內容發布。於CDN,因應客戶而動態地分派物理上接近的邊緣伺服器。然後,藉由對該邊緣伺服器快取及發布內容,可減少延遲。又,由於在發生某種錯誤時,或通訊狀態因流量增加等而改變時,以複數台邊緣伺服器分散處理,或將發布主體切換為其他邊緣伺服器,可繞過發生障礙的網路部分來繼續發布,因此可實現高速且穩定的發布。
又,不僅止於發布本身的分散處理,拍攝資料的編碼處理在各終端裝置或於伺服器側進行均可,或亦可互相分擔進行。作為一例,編碼處理一般進行2次處理循環。於第1次循環,檢出幀或場景單位的畫面複雜度或碼量。又,於第2次循環,進行維持畫質或使編碼效率提升的處理。例如終端裝置進行第1次的編碼處理,收到內容的伺服器側進行第2次編碼處理,藉此可減少各終端裝置的處理負載,同時可使內容的品質及效率提升。此時,若要求幾乎即時接收並解碼時,可將終端裝置進行的第1次編碼完成的資料,在其他終端裝置接收並播放,因此亦可實現更靈活的即時發布。
作為其他例,攝影機ex113等從圖像進行特徵量擷取,將有關特徵量的資料作為元資料壓縮,發送至伺服器。伺服器因應圖像的意義來進行壓縮,例如從特徵量,判斷物件的重要性而切換量子精度等。特徵量資料尤其對於在伺服器再度壓縮時,提升移動向量預測的精度及效率有效。又,於終端裝置進行VLC(可變長度編碼)等之簡易編碼,於伺服器進行CABAC(上下文適應型二值算術編碼方式)等處理負載大的編碼亦可。
進而言之,作為其他例,於體育館、購物中心或工廠等,有時存在藉由複數個終端裝置,拍攝大致同一場景的複數個影像資料。此時,利用進行攝影的複數個終端裝置、與因應需要而未進行拍攝的其他終端裝置及伺服器,以例如GOP(Group of Picture(圖片群組))單位、圖片單位或圖片經分割的方塊單位等,分別分派編碼處理來分散處理。藉此可減少延遲,更實現即時性。
又,由於複數個影像資料大致為同一場景,因此以伺服器管理及/或指示互相參考各終端裝置拍攝的影像資料亦可。或,伺服器接收來自各終端裝置的編碼完畢資料,於複數個資料間變更參考關係,或修正或更換圖片本身,予以重新編碼亦可。藉此,可生成提高每1個資料的品質及效率的串流。
又,伺服器亦可進行變更影像資料編碼方式的轉碼後,再發布影像資料。例如伺服器將MPEG系統的編碼方式,轉換成VP系統,或將H.264轉換成H.265均可。
如此,編碼處理可藉由終端裝置或1以上的伺服器來進行。故,以下作為進行處理的主體,雖採用「伺服器」或「終端」等記載,但由伺服器進行的處理的一部分或全部,亦可由終端裝置來進行,或由終端裝置進行的處理的一部分或全部,亦可由伺服器來進行。又,關於該等,就解碼處理而言亦同理。
[3D、多角度]
近年來,越來越多將由互相大致同步的複數個攝影機ex113及/或智慧型手機ex115等終端裝置所拍攝的不同場景、或從不同角度拍攝同一場景的圖像或影像予以整合利用。各終端裝置所拍攝的影像根據另外取得的終端裝置間的相對位置關係、或影像所含特徵點一致的區域等來整合。
伺服器不僅編碼二維的動態圖像,亦可根據動態圖像的場景分析等,自動或於使用者所指定的時刻,編碼靜止圖,並發送至接收終端裝置。伺服器進一步在可取得攝影終端裝置間的相對位置關係時,不僅根據二維的動態圖像,亦可根據從不同角度拍攝同一場景的影像,來生成該場景的三維形狀。再者,伺服器另外編碼點雲等所生成的三維資料,或利用三維資料來辨識人物或物件,或者根據追蹤的結果,從複數個終端裝置拍攝的影像,選擇或重構要發送至接收終端裝置的影像均可。
如此,使用者可任意選擇對應於各攝影終端裝置的各影像,欣賞場景,亦可欣賞從利用複數個圖像或影像重構的三維資料,切出任意視點的影像的內容。進而言之,與影像相同,聲音亦可從複數個不同角度來收音,伺服器配合影像,將來自特定角度或空間的聲音,與影像進行多工並發送。
又,近年來Virtual Reality(虛擬實境)(VR)及Augmented Reality(擴增實境)(AR)等使現實世界與虛擬世界相對應的內容亦日益普及。VR圖像時,伺服器分別製作右眼用及左眼用的視點圖像,藉由Multi-View Coding(多視角編碼)(MVC)等,進行各視點影像間容許參考的編碼,或互相不參考,作為不同的串流來編碼均可。於不同的串流解碼時,因應使用者的視點,使其互相同步播放,以重現虛擬的三維空間即可。
AR圖像時,伺服器對現實空間的攝影機資訊,根據三維位置或使用者的視點移動,來重疊虛擬空間上的虛擬物體資訊。解碼裝置亦可取得或保持虛擬物體資訊及三維資料,因應使用者的視點移動,來生成二維圖像,平滑地接合以製作重疊資料。又,解碼裝置除了發送虛擬物體資訊的請求以外,還將使用者的視點移動發送至伺服器,伺服器配合從保持於伺服器的三維資料所接收的視點移動,製作重疊資料,編碼重疊資料並發布至解碼裝置亦可。再者,重疊資料除了RGB以外,還具有表示穿透度的a值,伺服器亦可於從三維資料製作的物件以外部分的a值設定為0等,在該部分會穿透的狀態下編碼。或者,伺服器亦可如色度鍵,於背景設定預定值的RGB值,物件以外的部分設為背景色而生成資料。
同樣地,發布資料的解碼處理在作為客戶的各終端裝置或於伺服器側進行均可,或亦可互相分擔進行。作為一例,某終端裝置亦可暫時對伺服器發送接收要求,以其他終端裝置接收因應該要求的內容,進行解碼處理,並對具有顯示器的裝置,發送解碼完畢的訊號。不受可通訊的終端裝置本身的性能影響,將處理分散,選擇適當的內容,藉此可播放畫質良好的資料。又,作為其他例,亦可於TV等接收大尺寸的圖像資料,並且於觀賞者的個人終端裝置,解碼圖片經分割的方塊等一部分區域而顯示。藉此,可共有全體圖像,同時在手邊確認自身的負責領域或欲更詳細確認的區域。
又,今後預料在不受屋內外的影響,可使用複數種近距離、中距離或長距離的無線通訊的狀況下,利用MPEG-DASH等發布系統規格,對於連接中的通訊一面切換適當的資料,一面無縫地接收內容。藉此,使用者不侷限於自身的終端裝置,可一面自由地選擇設置於屋內外的顯示器等之解碼裝置或顯示裝置,一面即時地切換。又,可根據自身的位置資訊等,一面切換解碼的終端裝置及顯示的終端裝置,一面解碼。藉此,亦可於往目的地移動中,一面使嵌入可顯示設備的相鄰建築物的壁面或地面的一部分,顯示地圖資訊,一面移動。又,亦可根據在網路上對編碼資料的存取容易度,諸如編碼資料於可從接收終端裝置短時間存取的伺服器進行快取,或複製於內容發布服務的邊緣伺服器等,來切換接收資料的位元率。
[可適性編碼]
關於內容切換,利用圖43所示,應用上述各實施形態所示動態圖像編碼方法所壓縮編碼的可適性串流的特徵來說明。伺服器具有複數種內容相同、質不同的串流作為個別串流亦無妨,但亦可如圖示,活用藉由分層進行編碼所實現的時間性/空間性可適性串流的特徵,來切換內容而構成亦可。總言之,解碼側因應性能之內在要因與通訊頻帶狀態等外在要因,來決定解碼所至之層,解碼側藉此可自由切換低解像度的內容與高解像度的內容而解碼。例如移動中以智慧型手機ex115視聽的影像的後續,回家後想在網際網路TV等機器視聽時,該機器只要將相同串流解碼至不同層即可,因此可減輕伺服器側的負擔。
進而言之,除了如上述,實現就每層編碼圖片,於基礎層的高位存在有增強層的可適性的構成以外,增強層包含基於圖像統計資訊等之元資訊,解碼側根據元資訊,來將基礎層的圖片進行超解像,藉此生成高畫質的內容亦可。超解像亦可指同一解像度的SN比提升及解像度擴大的任一者。元資訊包含用以特定出使用於超解像處理的線性或非線性濾波器係數的資訊,或特定出使用於超解像處理的濾波處理、機械學習或最小平方運算的參數值的資訊等。
又,亦可構成如:因應圖像內的物件等的語意,將圖片分割為方塊等,解碼側選擇解碼的方塊,藉此僅解碼一部分區域。又,將物件屬性(人物、車、球等)及影像內位置(同一圖像內的座標位置等)作為元資訊儲存,藉此解碼側可根據元資訊,特定所需物件的位置,決定包含該物件的方塊。例如如圖44所示,元資訊利用HEVC的SEI訊息等,與像素資料不同的資料儲存構造來儲存。該元資訊表示例如主物件的位置、大小或色彩等。
又,以串流、序列、隨機存取單位等,以由複數個圖片所構成的單位,來儲存元資訊亦可。藉此,解碼側可取得特定人物出現在影像內的時刻等,藉由配合圖片單位的資訊,可特定物件所存在的圖片及圖片內物件的位置。
[網頁最佳化]
圖45是表示電腦ex111等之網頁的顯示畫面例的圖。圖46是表示智慧型手機ex115等之網頁的顯示畫面例的圖。如圖45及圖46所示,網頁有時包含複數個對圖像內容的連結的連結圖像,依瀏覽的設備,其觀看方式會不同。畫面上可看到複數個連結圖像時,顯示裝置(解碼裝置)顯示各內容所具有的靜止圖或I圖片作為連結圖像,或顯示複數個靜止圖或I圖像等諸如gif動畫的影像,亦或僅接收基礎層,解碼及顯示影像,直到使用者明確地選擇連結圖像,或連結圖像靠近圖像中央附近,或者連結圖像全體進入畫面內為止。
由使用者選擇了連結圖像時,顯示裝置將基礎層最優先解碼。再者,構成網頁的HTML具有表示可適性內容的資訊時,顯示裝置解碼至增強層亦可。又,為了保證即時性,在選擇前或通訊頻帶非常嚴苛時,顯示裝置僅解碼及顯示前方參考的圖片(I圖片、P圖片、僅前方參考的B圖片),藉此可減低開頭圖片的解碼時刻與顯示時刻之間的延遲(從內容開始解碼到開始顯示的延遲)。又,顯示裝置亦可特意忽視圖片的參考關係,進行前方參考,粗略地解碼所有B圖片及P圖片,隨著時間經過、接收的圖片增加而進行正常解碼。
[自動行駛]
又,為了車輛自動行駛或支援行駛而接收二維或三維地圖資訊等靜止圖或影像資料時,接收終端裝置亦可除了接收屬於1以上的層的圖像資料以外,亦接收天候或施工資訊等作為元資訊,使該等相對應而解碼。再者,元資訊屬於層,或單純與圖像資料進行多工均可。
此時,由於包含接收終端裝置的車輛、無人機或飛機等進行移動,因此接收終端裝置在接收要求時,發送該接收終端裝置的位置資訊,藉此可一面切換基地局ex106~ex110,一面實現無縫的接收及解碼。又,接收終端裝置可因應使用者的選擇、使用者的狀況或通訊頻帶的狀態,動態切換元資訊的接收程度或地圖資訊的更新程度。
如以上,於內容供給系統ex100,客戶可即時接收由使用者發送的經編碼的資訊,予以解碼並播放。
[個人內容發布]
又,於內容供給系統ex100,不僅可發布來自影像發布業者的高畫質、長時間的內容,亦可進行來自個人的低畫質、短時間之內容的單播或多播發布。又,該類個人內容今後應會日益增加。為了使個人內容成為更優質的內容,伺服器進行編輯處理後再進行編碼處理亦可。此可由例如以下構成來實現。
攝影時,伺服器即時或積存而在攝影後,從原圖像或編碼完畢的資料,進行攝影錯誤、場景估計、語意分析及物件檢出等辨識處理。然後,伺服器根據辨識結果,進行如下編輯:採手動或自動修正失焦或手震等,刪除亮度比其他圖片低、焦點未對準的場景等重要性低的場景,強調物件的邊緣,或使色調變化等。伺服器根據編輯結果來編碼編輯後的資料。又,已知若攝影時間過長,收視率會下降,伺服器亦可根據圖像處理結果,因應攝影時間,不僅自動剪輯如上述重要性低的場景,亦剪輯移動少的場景等,以使內容維持在特定時間範圍內。又,伺服器亦可根據場景的意義分析的結果,生成並編碼摘要。
再者,於個人內容亦出現直接拍到侵害著作權、著作人格權或肖像權等之內容的個案,亦出現共有的範圍超越了意圖的範圍等,對個人為不便的情況。故,例如伺服器亦可將圖像變更為特意使焦點,不對準畫面周邊部的人的臉部或家中等而編碼。又,伺服器亦可辨識編碼對象圖像內,是否拍到與預先登錄的人物不同的人物的臉部,拍到時,亦可進行對臉部部分,加上馬賽克等之處理。或,作為編碼前的預處理或後處理,亦可基於著作權等的觀點,指定使用者欲進行圖像加工的人物或背景區域,伺服器進行將指定的區域置換為其他影像,或模糊焦點等處理。若是人物,亦可一面於動態圖像追蹤人物,一面置換臉部部分的影像。
又,資料量少的個人內容的視聽,強烈要求即時性,因此雖依頻帶寬而不同,解碼裝置首先最優先接收基礎層,進行解碼及播放。解碼裝置在此期間接收增強層,於循環播放時等播放2次以上時,包含增強層在內而播放高畫質影像亦可。如此,若是進行可適性編碼的串流,可提供如下體驗:在未選擇時或開始觀看的階段,動畫雖粗略,但隨著串流智慧化,圖像改善。除了可適性編碼以外,將第1次所播放的粗略串流、及參考第1次動畫而編碼的第2次串流,作為1個串流而構成,亦可提供相同的體驗。
[其他使用例]
又,該等編碼或解碼處理一般在各終端裝置所具有的LSIex500處理。LSIex500為單晶片或由複數個晶片所組成的構成均可。再者,將動態圖像編碼或解碼用的軟體,組入電腦ex111等可讀取之某種記錄媒體(CD-ROM、軟碟、或硬碟等),利用該軟體進行編碼或解碼處理亦可。進而言之,智慧型手機ex115附有攝影機時,發送由該攝影機所取得的動畫資料亦可。此時的動畫資料是經智慧型手機ex115所具有的LSIex500進行編碼處理的資料。
再者,LSIex500亦可為下載應用軟體並啟用的構成。此時,終端裝置首先判斷該終端裝置是否支援內容的編碼方式,或是否具有特定服務的執行能力。終端裝置不支援內容的編碼方式時,或不具有特定服務的執行能力時,終端裝置下載內容或應用軟體,其後取得並播放內容。
又,不限於經由網際網路ex101的內容供給系統ex100,於數位播放用系統,亦可組入上述各實施形態的至少任一種動態圖像編碼裝置(圖像編碼裝置)或動態圖像解碼裝置(圖像解碼裝置)。由於利用衛星等,使播放用電波承載影像及聲音已被多工的多工資料來收發,因此相對於內容供給系統ex100容易進行單播的構成,其差異在於適合多播,但關於編碼處理及解碼處理,可進行同樣的應用。
[硬體構成]
圖47是表示智慧型手機ex115的一例的圖。又,圖48是表示智慧型手機ex115的構成例的圖。智慧型手機ex115具有:天線ex450,用以與基地局ex110之間收發電波;攝影機部ex465,可拍攝影像及靜止圖;及顯示部ex458,顯示由攝影機部ex465所拍攝的影像、及由天線ex450所接收的影像等經解碼的資料。智慧型手機ex115進一步具備:操作部ex466,其為觸控面板等;聲音輸出部ex457,用以輸出聲音或音響的揚聲器等;聲音輸入部ex456,用以進行聲音輸入的微音器等;記憶體部ex467,用以保存拍攝的影像或靜止圖、錄音的聲音、接收的影像或靜止圖、郵件等經編碼的資料,或經解碼的資料;及插槽部ex464,其是與SIMex468的介面部,前述SIMex468是用以特定出使用者,進行對於以網路為首之各種資料存取的認證。再者,亦可使用外接記憶體,來取代記憶體部ex467。
又,統籌控制顯示部ex458及操作部ex466等的主控制部ex460,經由匯流排ex470而與電源電路部ex461、操作輸入控制部ex462、影像訊號處理部ex455、攝影機介面部ex463、顯示器控制部ex459、調變/解調部ex452、多工/分離部ex453、聲音訊號處理部ex454、插槽部ex464及記憶體部ex467連接。
若藉由使用者操作而使電源鍵成為開啟狀態時,電源電路部ex461從電池組對於各部供給電力,將智慧型手機ex115啟動為可動作的狀態。
智慧型手機ex115根據由CPU、ROM及RAM等所組成的主控制部ex460的控制,進行通話及資料通訊等處理。通話時,以聲音訊號處理部ex454,將由聲音輸入部ex456所收音的聲音訊號,轉換成數位聲音訊號,並以調變/解調部ex452,將其進行頻譜擴散處理,以發送/接收部ex451施行數位類比轉換處理及頻率轉換處理後,經由天線ex450發送。又,放大接收資料,施行頻率轉換處理及類比數位轉換處理,並以調變/解調部ex452進行頻譜反擴散處理,以聲音訊號處理部ex454轉換成類比聲音資料後,從聲音輸出部ex457將其輸出。於資料通訊模式時,藉由主體部的操作部ex466等之操作,經由操作輸入控制部ex462,將文本、靜止圖或影像資料送出至主控制部ex460,並同樣地進行收發處理。資料通訊模式時發送影像、靜止圖或影像及聲音時,影像訊號處理部ex455將保存於記憶體部ex467的影像訊號、或從攝影機部ex465輸入的影像訊號,藉由上述各實施形態所示動態圖像編碼方法,予以壓縮編碼,將已被編碼的影像資料送出至多工/分離部ex453。又,聲音訊號處理部ex454將聲音訊號編碼,將已被編碼的聲音資料送出至多工/分離部ex453,其中該聲音訊號是在以攝影機部ex465拍攝影像或靜止圖等之過程,以聲音輸入部ex456收音的訊號。多工/分離部ex453以預定的方式,將編碼完畢影像資料及編碼完畢聲音資料予以多工,以調變/解調部(調變/解調電路部)ex452及發送/接收部ex451,施以調變處理及轉換處理,經由天線ex450來發送。
接收添附於電子郵件或聊天的影像、或連結於網頁等之影像時,為了解碼經由天線ex450所接收的多工資料,多工/分離部ex453藉由分離多工資料,來將多工資料區分為影像資料的位元串流與聲音資料的位元串流,經由同步匯流排ex470,將已被編碼的影像資料供給至影像訊號處理部ex455,並且將已被編碼的聲音資料供給至聲音訊號處理部ex454。影像訊號處理部ex455藉由對應於上述各實施形態所示動態圖像編碼方法的動態圖像解碼方法,解碼影像訊號,透過顯示器控制部ex459,從顯示部ex458顯示連結的動態圖像檔所含的影像或靜止圖。又,聲音訊號處理部ex454解碼聲音訊號,從聲音輸出部ex457輸出聲音。再者,由於即時串流化已普及,因此依使用者的狀況,亦可能發生聲音的播放就社會觀點而言不妥的情況。因此,作為初始值,宜採用不再生聲音訊號,僅播放影像訊號的構成。僅於使用者進行點擊影像資料等操作時,同步播放聲音亦可。
又,於此以智慧型手機ex115為例說明,但除了作為終端裝置具有編碼器及解碼器雙方的收發型終端裝置以外,亦可考慮僅具有編碼器的發送終端裝置及僅具有解碼器的接收終端裝置等3種實作形式。進而言之,說明了於數位播放用系統,接收或發送對影像資料多工有聲音資料等的多工資料,但於多工資料,除了聲音資料以外,與影像相關連的文字資料等亦可受到多工,或不接收或發送多工資料而接收或發送影像資料本身亦可。
再者,說明了包含CPU的主控制部ex460控制編碼或解碼處理,但終端裝置亦經常具備GPU。故,亦可構成如:藉由在CPU與GPU被共通化的記憶體,或藉由位址受管理以便可共通使用的記憶體,來活用GPU的性能以統一處理大區域。藉此,可縮短編碼時間,確保即時性,實現低延遲。特言之,不採用CPU而採用GPU,以圖片等為單位,統一進行移動估計、去區塊濾波、SAO(Sample Adaptive Offset(樣本適用性偏移))及轉換‧量化的處理甚有效率。
亦可將本態樣,與本發明的其他態樣的至少一部分組合而實施。又,亦可將本態樣的流程圖所記載的一部分處理、裝置的一部分構成、語法的一部分等,與其他態樣組合而實施。
產業上之可利用性
本發明可利用於例如電視接收機、數位錄影機、車用導航器、行動電話、數位相機、數位攝影機、電視會議系統或電子鏡等。
10~23‧‧‧區塊
100‧‧‧編碼裝置
102‧‧‧分割部
104‧‧‧減算部
106‧‧‧轉換部
108‧‧‧量化部
110‧‧‧熵編碼部
112、204‧‧‧反量化部
114、206‧‧‧反轉換部
116、208‧‧‧加算部
118、210‧‧‧區塊記憶體
120、212‧‧‧迴路濾波部
122、214‧‧‧幀記憶體
124、216‧‧‧幀內預測部
126、218‧‧‧幀間預測部
128、220‧‧‧預測控制部
160、260‧‧‧電路
162、262‧‧‧記憶體
200‧‧‧解碼裝置
202‧‧‧熵解碼部
ALF‧‧‧適應性迴路濾波器
AMT‧‧‧適應性多重轉換
AR‧‧‧擴增實境
AST‧‧‧適應性第二轉換
BIO‧‧‧雙向光流
CCLM‧‧‧跨組件線性模式
CABAC‧‧‧上下文適應型二值算術編碼方式
CDN‧‧‧內容發布網路
CTU‧‧‧編碼樹單元
CU‧‧‧編碼單元
Cur block‧‧‧目前區塊
DCT‧‧‧離散餘弦轉換
DF‧‧‧去區塊濾波器
DST‧‧‧離散正弦轉換
EMT‧‧‧顯式多重核心轉換
ex100‧‧‧內容供給系統
ex101‧‧‧網際網路
ex102‧‧‧網際網路服務提供者
ex103‧‧‧串流化伺服器
ex104‧‧‧通訊網
ex106~ex110‧‧‧基地局
ex111‧‧‧電腦
ex112‧‧‧遊戲機
ex113‧‧‧攝影機
ex114‧‧‧家電
ex115‧‧‧智慧型手機
ex116‧‧‧衛星
ex117‧‧‧飛機
ex450‧‧‧天線
ex451‧‧‧發送/接收部
ex452‧‧‧調變/解調部
ex453‧‧‧多工/分離部
ex454‧‧‧聲音訊號處理部
ex455‧‧‧影像訊號處理部
ex456‧‧‧聲音輸入部
ex457‧‧‧聲音輸出部
ex458‧‧‧顯示部
ex459‧‧‧顯示器控制部
ex460‧‧‧主控制部
ex461‧‧‧電源電路部
ex462‧‧‧操作輸入控制部
ex463‧‧‧攝影機介面部
ex464‧‧‧插槽部
ex465‧‧‧攝影機部
ex466‧‧‧操作部
ex467‧‧‧記憶體部
ex468‧‧‧SIM
ex470‧‧‧匯流排、同步匯流排
ex500‧‧‧LSI
FRUC‧‧‧幀率提升轉換
GOP‧‧‧圖片群組
HEVC‧‧‧高效率視訊編碼
MBT‧‧‧多型樹
MV、MV0、MV1、MV_L、MV_U‧‧‧移動向量
MVC‧‧‧多視角編碼
NSST‧‧‧不可分第二轉換
OBMC‧‧‧重疊區塊移動補償
PDPC‧‧‧獨立位置幀內預測組合
PMMVD‧‧‧模式匹配移動向量導出
Pred、Pred_L、Pred_U‧‧‧預測圖像
PU‧‧‧預測單元
QP‧‧‧量化參數
QTBT‧‧‧四元樹加二元樹
Ref0、Ref1‧‧‧參考圖片
S111~S115、S121~S123、S131~S132、S141、S151~S155、S161~S162、S171~S175、S201~S204、S211~S214、S221~S224、S301~S302、S311~S312‧‧‧步驟
SAO‧‧‧樣本適用性偏移
TU‧‧‧轉換單元
v0、v1、vx、vy‧‧‧移動向量
VLC‧‧‧可變長度編碼
VR‧‧‧虛擬實境
圖1是表示實施形態1的編碼裝置的功能構成的方塊圖。
圖2是表示實施形態1的區塊分割的一例的圖。
圖3是表示對應於各轉換類型的轉換基底函數的表。
圖4A是表示ALF所用的濾波器的形狀的一例的圖。
圖4B是表示ALF所用的濾波器的形狀的其他一例的圖。
圖4C是表示ALF所用的濾波器的形狀的其他一例的圖。
圖5A是表示幀內預測的67個幀內預測模式的圖。
圖5B是用以說明OBMC處理的預測圖像修正處理的概要的流程圖。
圖5C是用以說明OBMC處理的預測圖像修正處理的概要的概念圖。
圖5D是表示FRUC的一例的圖。
圖6是用以說明沿著移動軌道的2個區塊間的模式匹配(雙向匹配)的圖。
圖7是用以說明目前圖片內的模板與參考圖片內的區塊之間的模式匹配(模板匹配)的圖。
圖8是用以說明假定等速直線運動的模型的圖。
圖9A是用以說明根據複數個鄰接區塊的移動向量來導出子區塊單位的移動向量的圖。
圖9B是用以說明利用合併模式的移動向量導出處理的概要的圖。
圖9C是用以說明DMVR處理的概要的概念圖。
圖9D是用以說明利用LIC處理的亮度修正處理的預測圖像生成方法的概要的圖。
圖10是表示實施形態1的解碼裝置的功能構成的方塊圖。
圖11是實施形態1的第1態樣的編碼處理的流程圖。
圖12A是表示實施形態1的第1態樣的區塊分割例的圖。
圖12B是表示實施形態1的第1態樣的區塊分割例的圖。
圖13A是表示實施形態1的第1態樣的區塊分割例的圖。
圖13B是表示實施形態1的第1態樣的重複區域例的圖。
圖13C是表示實施形態1的第1態樣的重複區域例的圖。
圖14是表示實施形態1的第1態樣的區塊分割例的圖。
圖15是表示實施形態1的第1態樣的編碼處理的流程圖。
圖16是表示實施形態1的第1態樣的編碼處理的流程圖。
圖17是表示實施形態1的第1態樣的索引查找表的一例的圖。
圖18是表示實施形態1的第1態樣的索引的二值化例的圖。
圖19是表示實施形態1的第1態樣的編碼處理的流程圖。
圖20是表示實施形態1的第1態樣的索引查找表的一例的圖。
圖21是表示實施形態1的第2態樣的編碼處理的流程圖。
圖22A是表示實施形態1的第2態樣的區塊分割例的圖。
圖22B是表示實施形態1的第2態樣的區塊分割例的圖。
圖22C是表示實施形態1的第2態樣的區塊分割例的圖。
圖22D是表示實施形態1的第2態樣的區塊分割例的圖。
圖23是表示實施形態1的第2態樣的編碼處理的流程圖。
圖24是表示實施形態1的第3態樣的編碼處理的流程圖。
圖25是表示實施形態1的第3態樣的第1樣本集及第2樣本集之例的圖。
圖26是實施形態1的第4態樣的上下文切換處理的流程圖。
圖27是實施形態1的第4態樣的上下文切換例的圖。
圖28是實施形態1的第5態樣的上下文切換處理的流程圖。
圖29是實施形態1的第5態樣的上下文切換例的圖。
圖30是實施形態1的第5態樣的上下文切換例的圖。
圖31是表示實施形態1的第5態樣的區塊及物體的移動例的圖。
圖32是表示實施形態1的第5態樣的區塊例的圖。
圖33是表示實施形態1的第5態樣的上下文切換例的圖。
圖34是實施形態1的第6態樣的上下文切換處理的流程圖。
圖35是實施形態1的第6態樣的上下文切換例的圖。
圖36A是表示實施形態1的變形例的區塊分割例的圖。
圖36B是表示實施形態1的變形例的區塊分割例的圖。
圖36C是表示實施形態1的變形例的區塊分割例的圖。
圖36D是表示實施形態1的變形例的區塊分割例的圖。
圖37是表示實施形態1的第1參數、第2參數及處理例的圖。
圖38是實施形態1的解碼處理的流程圖。
圖39是實施形態1的解碼處理的流程圖。
圖40是表示編碼裝置的實作例的方塊圖。
圖41是表示解碼裝置的實作例的方塊圖。
圖42是表示實現內容發布服務的內容供給系統的全體構成圖。
圖43是表示可適性編碼時的編碼構造的一例的圖。
圖44是表示可適性編碼時的編碼構造的一例的圖。
圖45是表示網頁的顯示畫面例的圖。
圖46是表示網頁的顯示畫面例的圖。
圖47是表示智慧型手機的一例的圖。
圖48是表示智慧型手機的構成例的方塊圖。

Claims (26)

  1. 一種編碼裝置,具備: 電路;及 記憶體, 前述電路利用前述記憶體, 對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區且就各劃分區進行預測處理, 利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文。
  2. 如請求項1之編碼裝置,其中與前述周邊區塊的前述非矩形預測相關的前述第2資訊,是表示是否對前述周邊區塊適用非矩形預測的資訊。
  3. 如請求項1或2之編碼裝置,其中有關前述對象區塊的前述第1資訊,是與前述對象區塊的前述非矩形預測相關的前述第2資訊。
  4. 如請求項1或2之編碼裝置,其中有關前述對象區塊的前述第1資訊,是表示是否對前述對象區塊適用前述非矩形預測的資訊。
  5. 如請求項1或2之編碼裝置,其中有關前述對象區塊的前述第1資訊,是有關前述對象區塊的分割的資訊。
  6. 如請求項1或2之編碼裝置,其中前述非矩形劃分區為三角形劃分區。
  7. 如請求項1之編碼裝置,其中前述非矩形劃分區為三角形劃分區, 與前述周邊區塊的前述非矩形預測相關的前述第1資訊,是表示分割前述周邊區塊後的三角形劃分區的斜邊是否包含於前述對象區塊的資訊。
  8. 如請求項1或2之編碼裝置,其中前述周邊區塊為前述對象區塊的上鄰接區塊、左鄰接區塊、左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。
  9. 如請求項8之編碼裝置,其中前述周邊區塊為前述對象區塊的前述上鄰接區塊或前述左鄰接區塊。
  10. 如請求項8之編碼裝置,其中前述周邊區塊為前述對象區塊的前述左上鄰接區塊、前述右上鄰接區塊或前述左下鄰接區塊。
  11. 如請求項1或2之編碼裝置,其中於前述上下文的決定中,進一步利用前述對象區塊或前述周邊區塊的區塊分割階層,來決定前述上下文。
  12. 如請求項1或2之編碼裝置,其中於前述上下文的決定中,進一步利用前述對象區塊或前述周邊區塊的寬高比,來決定前述上下文。
  13. 一種解碼裝置,具備: 電路;及 記憶體, 前述電路利用前述記憶體, 對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理, 利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文。
  14. 如請求項13之解碼裝置,其中與前述周邊區塊的前述非矩形預測相關的前述第2資訊,是表示是否對前述周邊區塊適用非矩形預測的資訊。
  15. 如請求項13或14之解碼裝置,其中有關前述對象區塊的前述第1資訊,是與前述對象區塊的前述非矩形預測相關的前述第2資訊。
  16. 如請求項13或14之解碼裝置,其中有關前述對象區塊的前述第1資訊,是表示是否對前述對象區塊適用前述非矩形預測的資訊。
  17. 如請求項13或14之解碼裝置,其中有關前述對象區塊的前述第1資訊,是有關前述對象區塊的分割的資訊。
  18. 如請求項13或14之解碼裝置,其中前述非矩形劃分區為三角形劃分區。
  19. 如請求項13之解碼裝置,其中前述非矩形劃分區為三角形劃分區, 與前述周邊區塊的前述非矩形預測相關的前述第1資訊,是表示分割前述周邊區塊後的三角形劃分區的斜邊是否包含於前述對象區塊的資訊。
  20. 如請求項13或14之解碼裝置,其中前述周邊區塊為前述對象區塊的上鄰接區塊、左鄰接區塊、左上鄰接區塊、右上鄰接區塊或左下鄰接區塊。
  21. 如請求項20之解碼裝置,其中前述周邊區塊為前述對象區塊的前述上鄰接區塊或前述左鄰接區塊。
  22. 如請求項20之解碼裝置,其中前述周邊區塊為前述對象區塊的前述左上鄰接區塊、前述右上鄰接區塊或前述左下鄰接區塊。
  23. 如請求項13或14之解碼裝置,其中於前述上下文的決定中,進一步利用前述對象區塊或前述周邊區塊的區塊分割階層,來決定前述上下文。
  24. 如請求項13或14之解碼裝置,其中於前述上下文的決定中,進一步利用前述對象區塊或前述周邊區塊的寬高比,來決定前述上下文。
  25. 一種編碼方法,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理, 利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術編碼所用的上下文。
  26. 一種解碼方法,對藉由分割圖像所獲得的複數個區塊中之至少1個,適用非矩形預測,前述非矩形預測是將該區塊分割為包含非矩形劃分區的複數個劃分區,且就各劃分區進行預測處理, 利用與周邊區塊的前述非矩形預測相關的第2資訊,來決定有關對象區塊的第1資訊的算術解碼所用的上下文。
TW108101030A 2018-01-12 2019-01-10 編碼裝置、解碼裝置、編碼方法及解碼方法 TW201933869A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201862616758P 2018-01-12 2018-01-12
US62/616,758 2018-01-12

Publications (1)

Publication Number Publication Date
TW201933869A true TW201933869A (zh) 2019-08-16

Family

ID=67218341

Family Applications (1)

Application Number Title Priority Date Filing Date
TW108101030A TW201933869A (zh) 2018-01-12 2019-01-10 編碼裝置、解碼裝置、編碼方法及解碼方法

Country Status (2)

Country Link
TW (1) TW201933869A (zh)
WO (1) WO2019138998A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10893298B2 (en) * 2018-12-12 2021-01-12 Tencent America LLC Method and apparatus for video coding
WO2021037053A1 (en) 2019-08-27 2021-03-04 Huawei Technologies Co., Ltd. An encoder, a decoder and corresponding methods of cabac coding for the indices of geometric partition flag
WO2020251421A2 (en) * 2019-10-03 2020-12-17 Huawei Technologies Co., Ltd. Method and apparatus of high-level syntax for non-rectangular partitioning modes
US11265558B2 (en) * 2019-11-22 2022-03-01 Qualcomm Incorporated Cross-component adaptive loop filter
TWI821103B (zh) * 2022-01-10 2023-11-01 聯發科技股份有限公司 在視訊編解碼系統中使用邊界匹配進行重疊塊運動補償的方法和裝置

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0818344A2 (pt) * 2007-10-12 2015-04-22 Thomson Licensing Métodos e aparelhos para codificação e decodificação de vídeo de partições de modo bi-preditivo geometricamente particionadas
US10142627B2 (en) * 2015-06-18 2018-11-27 Qualcomm Incorporated Intra prediction and intra mode coding

Also Published As

Publication number Publication date
WO2019138998A1 (ja) 2019-07-18

Similar Documents

Publication Publication Date Title
CN110495177B (zh) 解码装置、解码方法及存储介质
JP7014881B2 (ja) 符号化装置及び符号化方法
TWI830328B (zh) 編碼裝置、解碼裝置及電腦可讀取之非暫時性媒體
TWI782974B (zh) 解碼裝置、解碼方法及非暫時性電腦可讀取媒體
JP7422811B2 (ja) 非一時的記憶媒体
TWI777907B (zh) 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體
JP7432653B2 (ja) 符号化装置、復号装置、符号化方法、及び復号方法
TW201933869A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
JP7017580B2 (ja) 復号装置、画像復号装置及び復号方法
TW202002648A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
JP2023165866A (ja) 符号化装置及び符号化方法
TW201921931A (zh) 編碼裝置、編碼方法、解碼裝置及解碼方法
TW201826796A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
JP2023126387A (ja) 符号化装置及び符号化方法
JPWO2020162536A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
JP2022058478A (ja) 符号化装置及び復号装置
TW201904293A (zh) 編碼裝置、編碼方法、解碼裝置及解碼方法
JPWO2020116241A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
TW201929549A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
WO2018097078A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
TW201909631A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
TW201826795A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
CN112136326B (zh) 编码装置、解码装置、编码方法和解码方法
WO2019244809A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
TW202011740A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法