TW201907719A - 編碼裝置、解碼裝置、編碼方法及解碼方法 - Google Patents

編碼裝置、解碼裝置、編碼方法及解碼方法 Download PDF

Info

Publication number
TW201907719A
TW201907719A TW107123150A TW107123150A TW201907719A TW 201907719 A TW201907719 A TW 201907719A TW 107123150 A TW107123150 A TW 107123150A TW 107123150 A TW107123150 A TW 107123150A TW 201907719 A TW201907719 A TW 201907719A
Authority
TW
Taiwan
Prior art keywords
division
node
nodes
granularity
tree structure
Prior art date
Application number
TW107123150A
Other languages
English (en)
Inventor
遠間正真
西孝啓
安倍清史
加納龍一
Original Assignee
美商松下電器(美國)知識產權公司
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 美商松下電器(美國)知識產權公司 filed Critical 美商松下電器(美國)知識產權公司
Publication of TW201907719A publication Critical patent/TW201907719A/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

提供實現進一步改良的編碼裝置。前述編碼裝置具備電路與記憶體,電路使用前述記憶體,從複數個分割模式,選擇編碼對象區塊之分割模式(步驟S11a),並依照語法來產生表示針對編碼對象區塊而選擇的分割模式之分割資訊,其中前述語法是以將前述複數個分割模式作為複數個節點來包含的樹狀結構為基準(步驟S12a)。在前述樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是: (i) 將第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者 (ii) 第2子樹內全部的節點之個別節點的分割粒度以下的大小。

Description

編碼裝置、解碼裝置、編碼方法及解碼方法
發明領域 本揭示係有關於編碼裝置、解碼裝置、編碼方法及解碼方法。
發明背景 稱為HEVC (High-Efficiency Video Coding)的影像編碼標準規格,是藉由JCT-VC (Joint Collaborative Team on Video Coding)而標準化。
先行技術文獻 非專利文獻 非專利文獻1:H.265(ISO/IEC 23008-2 HEVC (High Efficiency Video Coding))
發明概要 發明欲解決之課題 在如此的編碼及解碼技術中,要求更加的改良。
因此,本揭示之目的是提供一種可實現進一步改良的編碼裝置、解碼裝置、編碼方法或者解碼方法。
用以解決課題之手段 本揭示一態樣之編碼裝置具備電路與記憶體,前述電路使用前述記憶體,從複數個分割模式,選擇編碼對象區塊之分割模式,並依照語法來產生表示針對前述編碼對象區塊而選擇的前述分割模式之分割資訊,其中前述語法是以將前述複數個分割模式作為複數個節點來包含的樹狀結構為基準;在前述樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是:(i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者(ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。
本揭示一態樣之解碼裝置具備電路與記憶體,前述電路使用前述記憶體,將複數個分割模式作為複數個節點來包含,且特定出在解碼對象區塊中有效的樹狀結構之屬性,並依照以特定出的前述屬性之樹狀結構為基準的語法,來特定出針對前述解碼對象區塊而產生的分割資訊所表示的分割模式;在前述樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是:(i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者(ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。
另,該等概括性或者是具體性的態樣,可以利用系統、方法、積體電路、電腦程式,或者電腦可讀取之CD-ROM等之記錄媒體來實現,也可以利用系統、方法、積體電路、電腦程式、及記錄媒體的任意組合來實現。
發明效果 本揭示可提供一種可實現進一步改良的編碼裝置、解碼裝置、編碼方法或者解碼方法。
用以實施發明之形態 本揭示一態樣之編碼裝置具備電路與記憶體,前述電路使用前述記憶體,從複數個分割模式,選擇編碼對象區塊之分割模式,並依照語法來產生表示針對前述編碼對象區塊而選擇的前述分割模式之分割資訊,其中前述語法是以將前述複數個分割模式作為複數個節點來包含的樹狀結構為基準;在前述樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是:(i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者(ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。例如也可為:前述電路藉由針對樹狀結構之各節點來選擇分割模式,而產生前述編碼對象區塊之分割資訊之產生所使用的前述樹狀結構,且在前述樹狀結構之產生中,是以將選擇對象之節點作為根節點來包含的前述第1子樹內任意的節點之分割粒度大於前述第2子樹內任意的節點之分割粒度的方式,針對前述選擇對象之節點來選擇分割模式。又,前述複數個分割模式也可包含有將區塊3分割的分割模式。
藉此,樹狀結構之各父節點會被分歧成分割粒度大的子樹及分割粒度小的子樹,而可抑制在子樹內大分割粒度與小分割粒度混合存在的情況。因此,可使藉由該樹狀結構所表現的各區塊之分割資訊的發生機率具有偏差。結果,有可能使分割資訊因可變長度編碼而來的編碼量減低。
又,前述電路在前述樹狀結構之產生中,也可以分割粒度隨著前述樹狀結構之階層增加而單調增加或是單調減少的方式,針對各節點來選擇分割模式。
藉此,分割粒度會在樹狀結構之深度方向上連續地變化。因此,父節點與子節點中的分割資訊之發生機率之相關性會升高,分割資訊之可變長度編碼的效率有可能提升。
又,也可以是前述電路進而從複數個樹狀結構中,根據規定的編碼參數來選擇任一個樹狀結構,藉此切換前述編碼對象區塊之分割資訊之產生所使用的前述樹狀結構。
藉此,可使用適合於分割資訊之發生機率的樹狀結構,結果有可能提升分割資訊之可變長度編碼的效率。
又,也可是前述電路進而針對包含在前述複數個樹狀結構中全部的分割模式之個別模式,設定該分割模式之發生機率的初始值。
藉此,可抑制在分割資訊之可變長度編碼(具體為算術編碼)中,初始值不固定而誤動作的情況。
本揭示之一態樣的解碼裝置具備電路及記憶體,前述電路使用前述記憶體,將複數個分割模式作為複數個節點來包含,且特定出在解碼對象區塊中有效的樹狀結構之屬性,並依照以特定出的前述屬性之樹狀結構為基準的語法,來特定出針對前述解碼對象區塊而產生的分割資訊所表示的分割模式;在前述樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是:(i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者(ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。例如也可是:前述樹狀結構是藉由針對樹狀結構之各節點來選擇分割模式而產生,且在前述樹狀結構中,是以將選擇對象之節點作為根節點來包含的前述第1子樹內任意的節點之分割粒度大於前述第2子樹內任意的節點之分割粒度的方式,針對前述選擇對象之節點來選擇分割模式。又,也可是前述複數個分割模式包含有將區塊3分割的分割模式。
藉此,被特定之屬性的樹狀結構之各父節點會被分歧成分割粒度大的子樹及分割粒度小的子樹,而可抑制在子樹內大分割粒度與小分割粒度混合存在的情況。因此,可使藉由前述樹狀結構所表示的各區塊之分割資訊的發生機率具有偏差。結果,可將依照以前述樹狀結構為基準的語法而產生、且經過可變長度編碼之編碼量減低的分割資訊適宜地解碼。
又,在前述樹狀結構中,也可以分割粒度隨著前述樹狀結構之階層增加而單調增加或是單調減少的方式,針對各節點來選擇分割模式。
藉此,分割粒度會在樹狀結構之深度方向上連續地變化。因此,父節點與子節點中的分割資訊之發生機率之相關性會升高。結果,可將依照以前述樹狀結構為基準的語法而產生、且經過可變長度編碼之高編碼效率的分割資訊適宜地解碼。
又,也可以是前述電路進而從複數個樹狀結構中,根據規定的編碼參數來選擇任一個樹狀結構,藉此切換前述解碼對象區塊之分割模式之特定所使用的前述樹狀結構。
藉此,可使用適合於分割資訊之發生機率的樹狀結構,結果可將高編碼效率的分割資訊適宜地解碼。
又,也可是前述電路進而針對包含在前述複數個樹狀結構中全部的分割模式之個別模式,設定該分割模式之發生機率的初始值。
藉此,可抑制在分割資訊之可變長度解碼(具體為算術解碼)中,初始值不固定而誤動作的情況。
以下,一邊參考附圖一邊具體地說明實施形態。
另,在以下所說明的實施形態每一個都是顯示概括性或具體性的例子。在以下的實施形態中所示的數值、形狀、材料、構成要件、構成要件的配置位置及連接形態、步驟、步驟的順序等都只是一例罷了,其宗旨並非限定請求的範圍。又,以下的實施形態之構成要件中,針對未記載於表示最上位概念的獨立請求項之構成要件,是作為任意的構成要件來說明。
(實施形態1) 首先,說明實施形態1的概要,作為可適用在後述本揭示之各態樣中所說明的處理及/或構成之編碼裝置及解碼裝置的一例。惟,實施形態1只不過是可適用在本揭示之各態樣中所說明之處理及/或構成的編碼裝置及解碼裝置之一例罷了,在本揭示之各態樣中所說明的處理及/或構成也可實施於與實施形態1不同的編碼裝置及解碼裝置。
對於實施形態1適用在本揭示之各態樣中所說明的處理及/或構成時,例如亦可進行以下任一種方式。 (1)對於實施形態1之編碼裝置或者解碼裝置,在構成該編碼裝置或者解碼裝置之複數個構成要件之中,將與本揭示的各態樣中所說明的構成要件相對應的構成要件,替換成本揭示的各態樣中所說明的構成要件; (2) 對於實施形態1之編碼裝置或者解碼裝置,針對構成該編碼裝置或者解碼裝置之複數個構成要件中一部分的構成要件,先施予功能或者欲實施之處理的追加、替換、刪除等之任意的變更後,進一步將與本揭示之各態樣中所說明的構成要件相對應的構成要件,替換成本揭示之各態樣中所說明的構成要件; (3) 對於實施形態1之編碼裝置或者解碼裝置所要實施的方法,針對處理的追加、及/或該方法所包含的複數個處理中一部分的處理先施予替換、刪除等之任意的變更後,進一步將與本揭示的各態樣中所說明的處理相對應的處理,替換成本揭示的各態樣中所說明的處理; (4) 將構成實施形態1之編碼裝置或者解碼裝置之複數個構成要件中一部分的構成要件,和本揭示之各態樣中所說明的構成要件、具有本揭示之各態樣中所說明的構成要件所具備的功能之一部分的構成要件、或者要實施本揭示之各態樣中所說明之構成要件所要實施的處理之一部分的構成要件相組合而實施; (5)將具有構成實施形態1之編碼裝置或者解碼裝置之複數個構成要件中一部分的構成要件所具備的功能之一部分的構成要件、或者實施構成實施形態1之編碼裝置或者解碼裝置之複數個構成要件中一部分的構成要件所實施的處理之一部分的構成要件,和本揭示之各態樣中所說明之構成要件、具有在本揭示之各態樣中所說明之構成要件所具備的功能之一部分的構成要件、或者是實施本揭示之各態樣中所說明之構成要件所實施的處理之一部分的構成要件相組合來實施; (6)對於實施形態1之編碼裝置或者解碼裝置所要實施的方法,在該方法所包含的複數個處理之中,將與本揭示之各態樣中所說明的處理相對應的處理,替換成本揭示之各態樣中所說明的處理; (7)將實施形態1之編碼裝置或者解碼裝置所要實施的方法所包含之複數個處理中的一部分處理,和本揭示之各態樣中所說明的處理相組合來實施。
另,本揭示之各態樣中所說明之處理及/或構成的實施方式並不限於上述例子。例如,可以在與實施形態1中所揭示之動態圖像/圖像編碼裝置或者是動態圖像/圖像解碼裝置以不同目的被利用的裝置中實施,也可以單獨地實施已在各態樣中說明的處理及/或構成。又,也可將已在不同態樣中說明的處理及/或構成相組合來實施。
[編碼裝置的概要] 首先,說明實施形態1之編碼裝置之概要。圖1是顯示實施形態1之編碼裝置100之功能構成之方塊圖。編碼裝置100是將動態圖像/圖像以區塊單位進行編碼之動態圖像/圖像編碼裝置。
如圖1所示,編碼裝置100為將圖像以區塊單位進行編碼之裝置,包含有:分割部102、減法部104、轉換部106、量化部108、熵編碼部110、反量化部112、反轉換部114、加法部116、區塊記憶體118、迴路濾波部120、幀記憶體122、幀內預測部124、幀間預測部126、及預測控制部128。
編碼裝置100例如是藉由通用處理器及記憶體來實現。此時,當儲存在記憶體的軟體程式藉由處理器來執行時,處理器是作為分割部102、減法部104、轉換部106、量化部108、熵編碼部110、反量化部112、反轉換部114、加法部116、迴路濾波部120、幀內預測部124、幀間預測部126、及預測控制部128而發揮功能。又,編碼裝置100也可作為專用的1個以上的電子電路來實現,前述專用的1個以上的電子電路是對應於分割部102、減法部104、轉換部106、量化部108、熵編碼部110、反量化部112、反轉換部114、加法部116、迴路濾波部120、幀內預測部124、幀間預測部126、及預測控制部128。
以下,針對編碼裝置100所包含之各構成要件予以說明。
[分割部] 分割部102是將輸入動態圖像所包含之各圖片分割成複數個區塊,將各區塊輸出至減法部104。例如,分割部102首先將圖片分割成固定尺寸(例如128×128)之區塊。前述固定尺寸的區塊有時亦被稱為編碼樹單元(CTU)。接著,分割部102根據遞迴性的四元樹(quadtree)及/或二元樹(binary tree)區塊分割,將固定尺寸的區塊之每一個分割成可變尺寸(例如64×64以下)的區塊。這個可變尺寸的區塊有時亦被稱為編碼單元(CU)、預測單元(PU)或者轉換單元(TU)。另,在本實施形態中,亦可不必區別CU、PU及TU,而是圖片內的一部分或者全部的區塊皆成為CU、PU、TU的處理單位。
圖2是顯示實施形態1中的區塊分割一例之圖。在圖2中,實線是表示透過四元樹區塊分割所得到的區塊邊界,虛線是表示透過二元樹區塊分割所得到的區塊邊界。
在此,區塊10是128×128像素的正方形區塊(128×128區塊)。前述128×128區塊10首先是被分割成4個正方形的64×64區塊(四元樹區塊分割)。
左上的64×64區塊是進一步被垂直分割成2個矩形的32×64區塊,左邊的32×64區塊是進一步被垂直分割成2個矩形的16×64區塊(二元樹區塊分割)。其結果,左上的64×64區塊是被分割成2個16×64區塊11、12、及32×64區塊13。
右上的64×64區塊是被水平分割成2個矩形的64×32區塊14、15(二元樹區塊分割)。
左下的64×64區塊是被分割成4個正方形的32×32區塊(四元樹區塊分割)。4個32×32區塊之中,左上的區塊及右下的區塊被進一步分割。左上的32×32區塊是垂直分割成2個矩形的16×32區塊,右邊的16×32區塊是進一步被水平分割成2個16×16區塊(二元樹區塊分割)。右下的32×32區塊是被水平分割成2個32×16區塊(二元樹區塊分割)。其結果,左下的64×64區塊是被分割成1個16×32區塊16、2個16×16區塊17、18、2個32×32區塊19、20、及2個32×16區塊21、22。
右下的64×64區塊23不分割。
如上,在圖2中,區塊10是根據遞迴性的四元樹及二元樹區塊分割,而被分割成13個可變尺寸的區塊11至23。如此的分割,有時亦被稱為QTBT(quad-tree plus binary tree)分割。
另,在圖2中,1個區塊是被分割成4個或者2個區塊(四元樹或者二元樹區塊分割),但分割並不限於此。例如,1個區塊也可被分割成3個區塊(三元樹區塊分割)。如此包含三元樹區塊分割的分割有時亦被稱為MBT(multi type tree)分割。
[減法部] 減法部104是以由分割部102所分割的區塊單位,從原訊號(原樣本)減去預測訊號(預測樣本)。即,減法部104是算出編碼對象區塊(以下稱為當前區塊)的預測誤差(也稱為殘差)。接著,減法部104將所算出的預測誤差輸出至轉換部106。
原訊號是編碼裝置100的輸入訊號,為表示構成動態圖像之各圖片的圖像之訊號(例如亮度(luma)訊號及2個色差(chroma)訊號)。在下面內容中,也將表示圖像的訊號稱為樣本。
[轉換部] 轉換部106是將空間領域的預測誤差轉換成頻率領域的轉換係數,且將轉換係數輸出至量化部108。具體來說,轉換部106例如對於空間領域的預測誤差,進行已事先決定的離散餘弦轉換(DCT)或者離散正弦轉換(DST)。
另,轉換部106也可從複數個轉換類型中適應性地選擇轉換類型,使用對應於所選擇的轉換類型之轉換基底函數(transform basis function),將預測誤差轉換成轉換係數。如此轉換有時亦被稱為EMT(explicit multiple core transform)或者AMT(adaptive multiple transform)。
複數個轉換類型例如包括有DCT-II、DCT-V、DCT-VIII、DST-I及DST-VII。圖3是顯示對應於各轉換類型之轉換基底函數之表。在圖3中,N是顯示輸入像素的數量。欲從該等複數個轉換類型中選擇轉換類型,例如可依據預測的種類(幀內預測及幀間預測),也可依據幀內預測模式。
顯示是否適用如此的EMT或者AMT之資訊(例如被稱為AMT旗標)以及顯示被選擇的轉換類型之資訊,是以CU等級而被訊號化。另,該等資訊的訊號化不必限定在CU等級,也可為其他等級(例如序列等級(sequence level)、圖片等級(picture level)、切片等級(slice level)、圖塊等級(tile level)或者CTU等級)。
又,轉換部106也可將轉換係數(轉換結果)再轉換。如此再轉換有時亦被稱為AST(adaptive secondary transform)或者NSST(non-separable secondary transform)。例如,轉換部106是依對應於幀內預測誤差之轉換係數的區塊所包含之子區塊(例如4×4子區塊)的每一個而進行再轉換。顯示是否適用NSST的資訊及有關於使用在NSST之轉換矩陣的資訊是以CU等級進行訊號化。另,該等資訊的訊號化不必限定在CU等級,也可為其他等級(例如序列等級、圖片等級、切片等級、圖塊等級或者CTU等級)。
在此,Separable(可分離)的轉換是指以輸入的維度之數來按各個方向分離並進行複數次轉換的方式,Non-Separable(不可分離)的轉換是指在輸入為多維時將2個以上的維度統整視為1維,而一次進行轉換的方式。
例如,作為Non-Separable的轉換之1例,可舉例有如下者:在輸入為4×4的區塊時,將該區塊視為具有16個要件之一個陣列,對該陣列以16×16的轉換矩陣進行轉換處理。
又,同樣,將4×4的輸入區塊視為具有16個要件的一個陣列,之後對該陣列進行數次Givens(吉文斯)旋轉之構成(Hypercube Givens Transform/超立方體吉文斯轉換),也是Non-Separable轉換的例子。
[量化部] 量化部108是將從轉換部106所輸出的轉換係數進行量化。具體來說,量化部108是以規定的掃描順序來掃描當前區塊的轉換係數,並根據對應於所掃描的轉換係數的量化參數(QP)而將該轉換係數進行量化。然後,量化部108將當前區塊之業經量化的轉換係數(以下稱為量化係數)輸出至熵編碼部110及反量化部112。
規定的順序是轉換係數的量化/反量化用的順序。例如,規定的掃描順序是以頻率的升序(從低頻到高頻的順序)或者降序(從高頻到低頻的順序)來下定義。
量化參數係指定義量化步距(量化寬度)的參數。例如,若量化參數的值增加時,量化步距也會增加。即,若量化參數的值增加,量化誤差也會變大。
[熵編碼部] 熵編碼部110是將從量化部108輸入的量化係數進行可變長度編碼,藉此產生編碼訊號(編碼位元串流)。具體來說,熵編碼部110例如將量化係數二進位化,且將二進位訊號進行算術編碼。
[反量化部] 反量化部112是將從量化部108輸入的量化係數進行反量化。具體來說,反量化部112是以規定的掃描順序將當前區塊的量化係數進行反量化。然後,反量化部112將當前區塊的業經反量化的轉換係數輸出至反轉換部114。
[反轉換部] 反轉換部114是將從反量化部112輸入的轉換係數進行反轉換,藉此復原預測誤差。具體來說,反轉換部114是對轉換係數進行與轉換部106所進行的轉換對應之反轉換,藉此復原當前區塊的預測誤差。然後,反轉換部114將業已復原的預測誤差輸出至加法部116。
另,業已復原的預測誤差是因為量化而失去了資訊,因此和減法部104所算出的預測誤差不一致。即,在業已復原的預測誤差中含有量化誤差。
[加法部] 加法部116是將從反轉換部114輸入的預測誤差、與從預測控制部128輸入的預測樣本相加,藉此再構成當前區塊。然後,加法部116將業經再構成的區塊輸出至區塊記憶體118及迴路濾波部120。再構成區塊有時也被稱為局部解碼區塊。
[區塊記憶體] 區塊記憶體118是用以儲存區塊的記憶部,其中前述區塊為於幀內預測中被參考的區塊,且為編碼對象圖片(以下稱為當前圖片)內的區塊。具體來說,區塊記憶體118是儲存從加法部116所輸出的再構成區塊。
[迴路濾波部] 迴路濾波部120是對藉由加法部116而再構成的區塊施加迴路濾波,且將業經濾波的再構成區塊輸出至幀記憶體122。迴路濾波器是指在編碼迴路內所使用的濾波器(In-loop filter,迴路內濾波器),例如包括解區塊濾波器(Deblocking Filter,DF)、樣本適應性偏移(Sample Adaptive Offset,SAO)及適應性迴路濾波器(Adaptive Loop Filter,ALF)等。
在ALF中是適用用以移除編碼失真的最小平方誤差濾波器,例如按當前區塊內的2×2子區塊之每一個,根據局部性的梯度(gradient)的方向及活性度(activity),適用從複數個濾波器之中所選擇的1個濾波器。
具體來說,首先子區塊(例如2×2子區塊)被分類成複數個類別(例如15或者25類別)。子區塊的分類是根據梯度的方向及活性度來進行。例如,使用梯度的方向值D(例如0至2或者0至4)與梯度的活性值A(例如0至4)而算出分類值C(例如C=5D+A)。然後,根據分類值C,使子區塊被分類成複數個類別(例如15或者25類別)。
梯度的方向值D例如是藉由比較複數個方向(例如水平、垂直及2個對角方向)的梯度而導出。又,梯度的活性值A例如是將複數個方向的梯度相加,並藉由將相加結果進行量化來導出。
根據如此分類的結果,從複數個濾波器之中決定子區塊用的濾波器。
作為ALF所使用的濾波器的形狀,例如是利用圓對稱形狀。圖4A至圖4C是顯示ALF所使用的濾波器的形狀的數例之圖。圖4A是顯示5×5菱形形狀濾波器,圖 4B是顯示7×7菱形形狀濾波器,圖4C是顯示9×9菱形形狀濾波器。顯示濾波器的形狀之資訊是以圖片等級來進行訊號化。另,顯示濾波器的形狀之資訊的訊號化並不須限定在圖片等級,也可為其他等級(例如序列等級、切片等級、圖塊等級、CTU等級或者是CU等級)。
ALF的開啟/關閉,例如是以圖片等級或者CU等級來決定。例如,針對亮度,是以CU等級來決定是否適用ALF,針對色差,是以圖片等級來決定是否適用ALF。顯示ALF的開啟/關閉的資訊,是以圖片等級或者CU等級來進行訊號化。另,顯示ALF的開啟/關閉的資訊之訊號化,並無須限定在圖片等級或者CU等級,也可為其他等級(例如序列等級、切片等級、圖塊等級、或者CTU等級)。
可選擇的複數個濾波器(例如迄至15或25的濾波器)的係數組是以圖片等級進行訊號化。另,係數組的訊號化並無須限定在圖片等級,也可為其他等級(例如序列等級、切片等級、圖塊等級、CTU等級、CU等級或者是子區塊等級)。
[幀記憶體] 幀記憶體122是一種用以儲存被使用在幀間預測的參考圖片之記憶部,有時也被稱為幀緩衝器。具體來說,幀記憶體122是儲存已藉由迴路濾波部120濾波的再構成區塊。
[幀內預測部] 幀內預測部124是參考區塊記憶體118所儲存的當前圖片內的區塊,來進行當前區塊的幀內預測(也稱為畫面內預測),藉此產生預測訊號(幀內預測訊號)。具體來說,幀內預測部124是參考鄰接於當前區塊之區塊的樣本(例如亮度值、色差值)來進行幀內預測,藉此產生幀內預測訊號,且將幀內預測訊號輸出至預測控制部128。
例如,幀內預測部124利用已事先規定的複數個幀內預測模式之中的1個,來進行幀內預測。複數個幀內預測模式是包括1個以上的非方向性預測模式、及複數個方向性預測模式。
1個以上的非方向性預測模式包括例如以H.265/HEVC(High-Efficiency Video Coding/高效率視訊編碼)規格(非專利文獻1)所規定的Planar (平面)預測模式及DC(直流)預測模式。
複數個方向性預測模式包括例如以H.265/ HEVC規格所規定的33方向的預測模式。另,複數個方向性預測模式除了33方向外,也可進一步包括32方向的預測模式(合計共65個方向性預測模式)。圖5A是顯示幀內預測中的67個幀內預測模式(2個非方向性預測模式及65個方向性預測模式)之圖。實線箭頭是表示以H.265/HEVC規格所規定的33方向,虛線箭頭是表示追加的32方向。
另,在色差區塊的幀內預測中,亮度區塊也可被參考。即,也可根據當前區塊的亮度成分,預測當前區塊的色差成分。如此之幀內預測有時也被稱為CCLM (cross- component linear model)預測。像這種參考亮度區塊之色差區塊的幀內預測模式(例如被稱為CCLM模式),也可作為色差區塊的幀內預測模式之1種而加入。
幀內預測部124也可根據水平/垂直方向的參考像素的梯度,來補正幀內預測後的像素值。像這樣伴隨著補正的幀內預測有時被稱為PDPC(position dependent intra prediction combination)。顯示有無適用PDPC的資訊(例如被稱為PDPC旗標),例如是以CU等級而進行訊號化。另,前述資訊的訊號化並無須限定在CU等級,也可為其他等級(例如序列等級、圖片等級、切片等級、圖塊等級、或者CTU等級)。
[幀間預測部] 幀間預測部126是參考參考圖片,來進行當前區塊的幀間預測(也稱為畫面間預測),藉此產生預測訊號(幀間預測訊號),其中前述參考圖片是幀記憶體122所儲存的參考圖片,且為與當前圖片相異的參考圖片。幀間預測是以當前區塊或者當前區塊內的子區塊(例如4×4區塊)的單位來進行。例如,幀間預測部126是針對當前區塊或者子區塊,在參考圖片內進行移動估測(motion estimation)。接著,幀間預測部126是使用藉由移動估測而得到的移動資訊(例如移動向量)來進行移動補償,藉此產生當前區塊或者子區塊的幀間預測訊號。然後,幀間預測部126是將所產生的幀間預測訊號輸出至預測控制部128。
用於移動補償的移動資訊被訊號化。對於移動向量的訊號化,也可使用移動向量預測子(motion vector predictor)。即,移動向量與移動向量預測子間之差分也可被訊號化。
另,不僅使用透過移動估測所得到的當前區塊的移動資訊,也可使用鄰接區塊的移動資訊,來產生幀間預測訊號。具體來說,也可將以透過移動估測所得到的移動資訊為基準的預測訊號、與以鄰接區塊的移動資訊為基準的預測訊號予以加權加總,藉此以當前區塊內的子區塊單位來產生幀間預測訊號。如此之幀間預測(移動補償)有時被稱為OBMC (overlapped block motion compensation)。
在如此之OBMC模式中,顯示OBMC用的子區塊的尺寸之資訊(例如被稱為OBMC區塊尺寸)是以序列等級而被訊號化。又,顯示是否適用OBMC模式之資訊(例如被稱為OBMC旗標)是以CU等級而被訊號化。另,該等資訊的訊號化的等級並無須限定在序列等級及CU等級,也可為其他等級(例如圖片等級、切片等級、圖塊等級、CTU等級或者子區塊等級)。
針對OBMC模式更具體地來進行說明。圖5B及圖5C是用以說明OBMC處理所進行的預測圖像補正處理的概要之流程圖及概念圖。
首先,使用被分配到編碼對象區塊之移動向量(MV),取得依通常的移動補償所得到之預測圖像(Pred)。
其次,將已編碼完畢的左鄰接區塊的移動向量(MV_L)適用在編碼對象區塊,取得預測圖像(Pred_L),將前述預測圖像與Pred_L加權、重疊,藉此進行預測圖像的第1次補正。
以同樣方式,將已編碼完畢之上鄰接區塊的移動向量(MV_U)適用在編碼對象區塊,取得預測圖像 (Pred_U),將前述已進行第1次補正的預測圖像與Pred_U加權、重疊,藉此進行預測圖像的第2次補正,並將其作為最後的預測圖像。
另,在此說明了使用左鄰接區塊與上鄰接區塊的2階段補正的方法,但也能作成如下構成,即,使用右鄰接區塊或下鄰接區塊,進行比2階段更多次數的補正。
另,進行重疊的區域也可僅為區塊邊界附近之一部分的區域,而非區塊整體的像素區域。
另,在此雖是針對來自1張參考圖片的預測圖像補正處理進行說明,但是在從複數張參考圖片補正預測圖像的情況下也是同樣,在取得從各參考圖片補正的預測圖像後,將得到的預測圖像進一步重疊,藉此作為最後的預測圖像。
另,前述處理對象區塊既可為預測區塊單位,也可為將預測區塊進一步加以分割的子區塊單位。
作為判定是否適用OBMC處理的方法,例如有使用obmc_flag之方法,前述obmc_flag是顯示是否適用OBMC處理的訊號。以一具體例來說,在編碼裝置中,判定編碼對象區塊是否屬於移動為複雜的區域,在屬於移動為複雜的區域時,設定值為1來作為obmc_flag,並適用OBMC處理而進行編碼,在不屬於移動為複雜的區域時,則設定值為0來作為obmc_flag,不適用OBMC處理而進行編碼。另一方面,在解碼裝置中,將記述在串流的obmc_flag解碼,藉此因應該值切換是否適用OBMC處理而進行解碼。
另,移動資訊也可在不被訊號化之狀態下在解碼裝置側導出。例如,也可採用以H.265/HEVC規格所規定的合併模式。又,例如也可於解碼裝置側進行移動估測,藉此導出移動資訊。此時,在不使用當前區塊的像素值之狀態下進行移動估測。
在此,針對在解碼裝置側進行移動估測的模式來說明。前述在解碼裝置側進行移動估測的模式有時被稱為PMMVD(pattern matched motion vector derivation)模式或者FRUC(frame rate up-conversion)模式。
FRUC處理之一例是顯示在圖5D中。首先,參考空間上或時間上鄰接於當前區塊的編碼完畢區塊之移動向量,產生複數個候選的清單(也可與合併清單為共通),前述複數個候選的清單各自具有移動向量預測子。其次,從已登錄在候選清單的複數個候選MV之中選擇最佳候選MV。例如,算出候選清單所包含之各候選的評價值,根據評價值而選擇1個候選。
接著,根據所選擇的候選移動向量,導出當前區塊用的移動向量。具體來說,例如將所選擇的候選移動向量(最佳候選MV)直接導出而作為當前區塊用的移動向量。又,例如也可在參考圖片內的位置的周邊區域中進行樣式(pattern)匹配,藉此導出當前區塊用的移動向量,其中前述參考圖片是對應於所選擇之候選移動向量。即,亦可對於最佳候選MV之周邊的區域,以同樣的方法進行估測,且在有評價值為更好的值之MV時,將最佳候選MV更新為前述MV,將前述MV當作當前區塊之最後的MV。另,也可做成不實施該處理之構成。
在以子區塊單位進行處理時,也可構成為完全同樣的處理。
另,可透過對應於移動向量之參考圖片內的區域與規定區域之間的樣式匹配而求出再構成圖像的差分值,藉此算出評價值。另,除了差分值外,也可使用除此以外的資訊來算出評價值。
作為樣式匹配,是使用第1樣式匹配或者第2樣式匹配。第1樣式匹配及第2樣式匹配有時分別被稱為雙向匹配(bilateral matching)以及模板匹配(template matching)。
在第1樣式匹配中,是在2個區塊之間進行樣式匹配,前述2個區塊是不同的2個參考圖片內的2個區塊,且沿著當前區塊的移動軌跡(motion trajectory)。因此,在第1樣式匹配中,是使用沿著當前區塊的移動軌跡的其他參考圖片內之區域,來作為用來算出上述候選之評價值的規定區域。
圖6是用以說明在沿著移動軌跡的2個區塊間之樣式匹配(雙向匹配)的一例之圖。如圖6所示,在第1樣式匹配下,在沿著當前區塊(Cur block)的移動軌跡之2個區塊且為不同的2個參考圖片(Ref0、Ref1)內的2個區塊之配對(pair)中,估測最為相配的配對,藉此導出2個移動向量(MV0、MV1)。具體來說,對於當前區塊,導出以候選MV所指定的第1編碼完畢參考圖片(Ref0)內的指定位置之再構成圖像、與以對稱MV所指定的第2編碼完畢參考圖片(Ref1)內的指定位置之再構成圖像間的差分,並使用所得到的差分值來算出評價值,其中前述對稱MV是將前述候選MV以顯示時間間隔進行縮放(scaling)的MV。在複數個候選MV之中選擇評價值為最佳值的候選MV作為最後MV即可。
在假設移動軌跡是連續的情況下,指示出2個參考區塊的移動向量(MV0、MV1)是相對於當前圖片(Cur Pic)與2個參考圖片(Ref0、Ref1)間之時間上的距離(TD0、TD1)成比例。例如,在當前圖片在時間上是位於2個參考圖片之間,且從當前圖片到2個參考圖片的時間上的距離相等時,在第1樣式匹配中,能導出鏡射對稱的雙向之移動向量。
在第2樣式匹配中,是在當前圖片內的模板(在當前圖片內鄰接於當前區塊的區塊(例如上及/或左鄰接區塊))與參考圖片內的區塊之間進行樣式匹配。因此,在第2樣式匹配中,是使用鄰接於當前圖片內的當前區塊的區塊,來作為用來算出上述候選之評價值的規定區域。
圖7是用以說明在當前圖片內的模板與參考圖片內的區塊之間的樣式匹配(模板匹配)的一例之圖。如圖7所示,在第2樣式匹配中,是在參考圖片(Ref0)內估測與當前圖片(Cur Pic)內鄰接於當前區塊(Cur block)之區塊最匹配的區塊,藉此導出當前區塊的移動向量。具體來說,對於當前區塊,導出左鄰接及上鄰接兩邊或者任一邊的編碼完畢區域的再構成圖像、與以候選MV所指定的編碼完畢參考圖片(Ref0)內的同等位置的再構成圖像間的差分,且使用所得到的差分值算出評價值,並且在複數個候選MV之中選擇評價值為最佳值的候選MV作為最佳候選MV即可。
如此之顯示是否適用FRUC模式的資訊(例如被稱為FRUC旗標)是以CU等級而被訊號化。又,在適用FRUC模式時(例如FRUC旗標為真時),顯示樣式匹配之方法(第1樣式匹配或者第2樣式匹配)的資訊(例如被稱為FRUC模式旗標)是以CU等級而被訊號化。另,該等資訊之訊號化並不須限定於CU等級,也可為其他等級(例如序列等級、圖片等級、切片等級、圖塊等級、CTU等級或者子區塊等級)。
在此,針對根據模型來導出移動向量的模式進行說明,其中前述模型是假設為等速直線運動的模型。前述模式有時被稱為BIO (bi-directional optical flow,雙向光流)模式。
圖8是用以說明假設為等速直線運動的模型之圖。在圖8中,(vx ,vy )是表示速度向量,τ0 、τ1 各表示當前圖片 (Cur Pic)與2個參考圖片(Ref0 ,Ref1 )間的時間上的距離。(MVx0 ,MVy0 )是表示對應於參考圖片Ref0 的移動向量,(MVx1 、MVy1 )是表示對應於參考圖片Ref1 的移動向量。
此時,在速度向量(vx ,vy )為等速直線運動的假設下,(MVx0 ,MVy0 )及(MVx1 ,MVy1 )各表示為(vx τ0 ,vy τ0 )及(-vx τ1 ,-vy τ1 ),以下的光流等式(1)成立。 (數式1)
在此,I(k) 是表示移動補償後之參考圖像k(k=0,1)的亮度值。前述光流等式是表示以下(i)、(ii)、(iii)之和等於零:(i)亮度值的時間微分、(ii)水平方向的速度及參考圖像的空間梯度的水平成分的乘積、與(iii)垂直方向的速度及參考圖像的空間梯度的垂直成分的乘積。根據前述光流等式與赫米特內插法(Hermite interpolation)之組合,將從合併清單等所得到的區塊單位之移動向量以像素單位進行補正。
另,也可利用與根據假設等速直線運動的模型之移動向量的導出不同的方法,在解碼裝置側導出移動向量。例如,也可根據複數個鄰接區塊的移動向量,而以子區塊單位導出移動向量。
在此,針對根據複數個鄰接區塊的移動向量而以子區塊單位導出移動向量的模式進行說明。前述模式有時被稱為仿射移動補償預測(affine motion compensation prediction)模式。
圖9A是用以說明子區塊單位的移動向量之導出之圖,前述導出是根據複數個鄰接區塊的移動向量來進行。在圖9A中,當前區塊含有16個4×4子區塊。在此,根據鄰接區塊的移動向量,導出當前區塊的左上角控制點的移動向量v0 ,且根據鄰接子區塊的移動向量,導出當前區塊的右上角控制點的移動向量v1 。接著,使用2個移動向量v0 及v1 ,藉由以下的式(2),導出當前區塊內的各子區塊的移動向量(vx ,vy )。 (數式2)
在此,x及y各表示子區塊的水平位置及垂直位置,w表示已事先決定的加權係數。
在如此之仿射移動補償預測模式中,也可包括左上及右上角控制點的移動向量之導出方法為相異的幾個模式。顯示如此之仿射移動補償預測模式的資訊(例如被稱為仿射旗標)是以CU等級而被訊號化。另,顯示前述仿射移動補償預測模式之資訊的訊號化無須限定在CU等級,也可為其他等級(例如序列等級、圖片等級、切片等級、圖塊等級、CTU等級或者子區塊等級)。
[預測控制部] 預測控制部128是選擇幀內預測訊號及幀間預測訊號之任一種,且將所選擇的訊號作為預測訊號而輸出至減法部104及加法部116。
在此,說明藉由合併模式而導出編碼對象圖片的移動向量之例。圖9B是用以說明藉由合併模式而進行之移動向量導出處理之概要的圖。
首先,產生已登錄預測MV之候選的預測MV清單。作為預測MV的候選,包括有以下MV等:空間鄰接預測MV,是編碼對象區塊之空間上位於周邊的複數個編碼完畢區塊所具有的MV;時間鄰接預測MV,是投影了編碼完畢參考圖片中的編碼對象區塊之位置的附近區塊所具有的MV;結合預測MV,是組合空間鄰接預測MV及時間鄰接預測MV之MV值而產生的MV;以及零預測MV,是值為零的MV。
其次,從已登錄在預測MV清單的複數個預測MV之中選擇1個預測MV,藉此將之決定為編碼對象區塊的MV。
進而,在可變長度編碼部中,將merge_idx記述在串流中並進行編碼,其中前述merge_idx是顯示已選擇哪一預測MV的訊號。
另,登錄在圖9B中所說明的預測MV清單的預測MV只是一個例子,也可為和圖中的個數不同的個數,或者構成為不包含圖中的預測MV之一部分的種類,或者構成為追加了圖中的預測MV種類以外的預測MV。
另,也可使用藉由合併模式所導出之編碼對象區塊的MV,進行後述的DMVR處理,藉此來決定最後的MV。
在此,針對使用DMVR處理來決定MV之例進行說明。
圖9C是用以說明DMVR處理的概要之概念圖。
首先,以已設定於處理對象區塊的最適合的MVP作為候選MV,並依照前述候選MV,從L0方向的處理完畢圖片即第1參考圖片、及L1方向的處理完畢圖片即第2參考圖片分別取得參考像素,取各參考像素的平均,藉此產生模板。
其次,使用前述模板,分別估測第1參考圖片及第2參考圖片的候選MV之周邊區域,將成本成為最小的MV決定為最後的MV。另,成本值是利用模板的各像素值與估測區域的各像素值之差分值及MV值等來算出。
另,在此所說明的處理之概要在編碼裝置及解碼裝置中基本上是共通的。
另,就算不是在此所說明的處理內容,只要是能估測候選MV的周邊而導出最後的MV之處理,也可使用其他處理。
在此,針對使用LIC處理來產生預測圖像的模式進行說明。
圖9D是用以說明使用LIC處理之亮度補正處理的預測圖像產生方法之概要的圖。
首先,從參考圖片導出MV,其中該參考圖片是編碼完畢圖片,該MV是用以取得對應於編碼對象區塊之參考圖像的MV。
其次,對於編碼對象區塊,使用左鄰接及上鄰接之編碼完畢周邊參考區域的亮度像素值、與位於以MV所指定的參考圖片內之同等位置的亮度像素值來擷取資訊,算出亮度補正參數,其中前述資訊是顯示亮度值在參考圖片與編碼對象圖片中如何變化的資訊。
對於以MV所指定的參考圖片內之參考圖像,使用前述亮度補正參數進行亮度補正處理,藉此產生相對於編碼對象區塊之預測圖像。
另,圖9D中的前述周邊參考區域的形狀只是其中一例,也可使用除此以外的形狀。
又,在此已針對從1張參考圖片來產生預測圖像的處理進行說明,但從複數張參考圖片來產生預測圖像的情況也是同樣,先對已從各個參考圖片所取得的參考圖像以同樣的方法進行亮度補正處理,再產生預測圖像。
作為判定是否適用LIC處理的方法,例如有使用lic_flag的方法,前述lic_flag是顯示是否適用LIC處理的訊號。以具體的一例來說,在編碼裝置中,判定編碼對象區塊是否屬於發生亮度變化之區域,若屬於發生亮度變化的區域,對lic_flag設定其值為1,適用LIC處理而進行編碼,若不屬於發生亮度變化之區域,則對lic_flag設定其值為0且不適用LIC處理而進行編碼。另一方面,在解碼裝置中,將記述於串流之lic_flag進行解碼,藉此因應該值而切換是否適用LIC處理來進行解碼。
作為判定是否適用LIC處理之另一方法,例如還有依照是否已在周邊區塊適用LIC處理而進行判定的方法。以具體的一例來說,編碼對象區塊為合併模式時,判定在合併模式處理中之MV導出時所選擇的周邊之編碼完畢區塊是否已適用LIC處理而進行編碼,再因應其結果切換是否適用LIC處理而進行編碼。另,前述例的情況在解碼的處理也是完全相同。
[解碼裝置的概要] 其次,針對解碼裝置之概要進行說明,前述解碼裝置可將從上述編碼裝置100所輸出的編碼訊號(編碼位元串流)進行解碼。圖10是顯示實施形態1之解碼裝置200的功能構成之方塊圖。解碼裝置200是以區塊單位而將動態圖像/圖像進行解碼的動態圖像/圖像解碼裝置。
如圖10所示,解碼裝置200包含有:熵解碼部202、反量化部204、反轉換部206、加法部208、區塊記憶體210、迴路濾波部212、幀記憶體214、幀內預測部216、幀間預測部218、及預測控制部220。
解碼裝置200例如可藉由通用處理器及記憶體來實現。此時,儲存於記憶體的軟體程式藉由處理器來執行時,處理器是作為熵解碼部202、反量化部204、反轉換部206、加法部208、迴路濾波部212、幀內預測部216、幀間預測部218、及預測控制部220而運作。又,解碼裝置200也可作為對應於熵解碼部202、反量化部204、反轉換部206、加法部208、迴路濾波部212、幀內預測部216、幀間預測部218、及預測控制部220之專用的1個以上的電子電路而實現。
以下,針對解碼裝置200所包含之各構成要件予以說明。
[熵解碼部] 熵解碼部202是將編碼位元串流進行熵解碼。具體來說,熵解碼部202例如是從編碼位元串流算術解碼成二進位訊號。接著,熵解碼部202將二進位訊號多值化(debinarize)。藉此,熵解碼部202以區塊單位而將量化係數輸出至反量化部204。
[反量化部] 反量化部204是將從熵解碼部202輸入的解碼對象區塊(以下稱為當前區塊)的量化係數進行反量化。具體來說,反量化部204是針對當前區塊的量化係數之各個,根據對應於該量化係數之量化參數,而將該量化係數進行反量化。然後,反量化部204將當前區塊的業經反量化之量化係數(即轉換係數)輸出至反轉換部206。
[反轉換部] 反轉換部206是將從反量化部204輸入的轉換係數進行反轉換,藉此復原預測誤差。
例如已從編碼位元串流解讀的資訊是顯示適用EMT或者AMT的時候(例如AMT旗標為真),反轉換部206根據顯示已解讀的轉換類型的資訊,將當前區塊的轉換係數進行反轉換。
又,例如已從編碼位元串流解讀的資訊是顯示適用NSST的時候,反轉換部206對轉換係數適用反再轉換。
[加法部] 加法部208是將預測誤差與預測樣本相加,藉此再構成當前區塊,其中前述預測誤差是來自反轉換部206之輸入,前述預測樣本是來自預測控制部220之輸入。然後,加法部208將業經再構成的區塊輸出至區塊記憶體210及迴路濾波部212。
[區塊記憶體] 區塊記憶體210是用以儲存在幀內預測中被參考的區塊且為解碼對象圖片(以下稱為當前圖片)內的區塊之記憶部。具體來說,區塊記憶體210是儲存從加法部208所輸出的再構成區塊。
[迴路濾波部] 迴路濾波部212是對已藉由加法部208再構成的區塊施行迴路濾波,且將業已濾波的再構成區塊輸出至幀記憶體214及顯示裝置等。
當顯示已從編碼位元串流解讀的ALF之開啟/關閉的資訊是顯示ALF開啟的時候,根據局部的梯度方向及活性度,從複數個濾波器之中選擇1個濾波器,將所選擇的濾波器適用於再構成區塊。
[幀記憶體] 幀記憶體214是用以儲存使用在幀間預測的參考圖片之記憶部,有時候也被稱為幀緩衝器。具體來說,幀記憶體214是儲存藉由迴路濾波部212所濾波的再構成區塊。
[幀內預測部] 幀內預測部216是根據已從編碼位元串流解讀的幀內預測模式,而參考區塊記憶體210所儲存的當前圖片內之區塊來進行幀內預測,藉此產生預測訊號(幀內預測訊號)。具體來說,幀內預測部216是參考鄰接於當前區塊的區塊之樣本(例如亮度值、色差值)而進行幀內預測,藉此產生幀內預測訊號,且將幀內預測訊號輸出至預測控制部220。
另,在色差區塊的幀內預測中選擇了參考亮度區塊的幀內預測模式時,幀內預測部216也可根據當前區塊的亮度成分,預測當前區塊的色差成分。
又,在已從編碼位元串流解讀的資訊是顯示適用PDPC時,幀內預測部216是根據水平/垂直方向的參考像素的梯度,來補正幀內預測後的像素值。
[幀間預測部] 幀間預測部218是參考幀記憶體214所儲存的參考圖片來預測當前區塊。預測是以當前區塊或者當前區塊內的子區塊(例如4×4區塊)的單位進行。例如,幀間預測部218使用已從編碼位元串流解讀的移動資訊(例如移動向量)來進行移動補償,藉此產生當前區塊或者子區塊的幀間預測訊號,且將幀間預測訊號輸出至預測控制部220。
另,在已從編碼位元串流解讀的資訊是顯示適用OBMC模式時,幀間預測部218不只是使用藉由移動估測而得到的當前區塊的移動資訊,還使用鄰接區塊的移動資訊來產生幀間預測訊號。
又,在已從編碼位元串流解讀的資訊是顯示適用FRUC模式時,幀間預測部218依照已從編碼串流解讀的樣式匹配的方法(雙向匹配或者模板匹配)進行移動估測,藉此導出移動資訊。然後,幀間預測部218使用所導出的移動資訊來進行移動補償。
又,幀間預測部218在適用BIO模式時,是根據假設等速直線運動之模型而導出移動向量。又,在已從編碼位元串流解讀的資訊顯示適用仿射移動補償預測模式時,幀間預測部218是根據複數個鄰接區塊的移動向量,而以子區塊單位導出移動向量。
[預測控制部] 預測控制部220是選擇幀內預測訊號及幀間預測訊號之任一者,且將所選擇的訊號作為預測訊號,輸出至加法部208。
(實施型態2) 本實施型態中的編碼裝置100與實施型態1同樣,具有圖1所示的構成。又,本實施型態中的編碼裝置100之分割部102相對於實施型態1具有附加的功能,或者是替代的功能。
[編碼裝置之分割部的處理流程] 在編碼區塊,可從作為基準的區塊尺寸來依序分割該區塊。在分割部102,會選擇評價值較小的編碼區塊之分割形狀,其中前述評價值是根據RD (Rate-Distortion: 位元率-失真)等來設計。
圖11是顯示分割模式之一例的圖。分割部102如圖11的(a)所示,將父區塊(也稱基準區塊)分割成4個區塊,如圖11的(b)所示分割成3個矩形區塊,或者如圖11的(c)所示分割成2個矩形區塊。另,圖11的(a)、(b)、及(c)所示的分割,分別稱為4分割(QT)、3分割(TT)、以及2分割(BT)。針對3分割與2分割,可選擇水平與垂直2個分割方法。具體上,3分割有水平方向的3分割(HT)與垂直方向的3分割(VT),而2分割有水平方向的2分割(HB)與垂直方向的2分割(VB)。即,圖11中總共顯示5種類的分割形狀之例。換言之,分割部102有5種類的分割模式。又,分割部102也可具備:稱為分裂(S:Split)的分割模式,表示進行進一步的分割;以及稱為非分裂(NS:Non Split)的分割模式,表示不進行分割。例如,分割部102以CTU (Coding Tree Unit)等區塊為起點,一邊從該等分割模式中選擇任一模式,一邊重複區塊之分割直到滿足規定的條件為止。前述規定的條件為下列等條件:以上述的RD等為基準的評價值達到規定的閾值、或是分割的階層數達到規定的最大值、或是分割後的區塊尺寸達到規定的最小尺寸。當滿足如此條件時,會決定區塊之最後的分割尺寸與形狀。
分割部102會依照以樹狀結構來表現的語法來產生分割資訊,其中前述分割資訊是將用以表現最後的分割尺寸與形狀的分割模式予以表示。即,分割部102會從複數個分割模式,選擇編碼對象區塊之分割模式。並且,分割部102會依照語法來產生表示針對前述編碼對象區塊而選擇的分割模式之分割資訊,其中前述語法是以將複數個分割模式作為複數個節點來包含的樹狀結構為基準。熵編碼部110會將前述分割資訊做可變長度編碼。
圖12是流程圖,顯示實施形態2中由編碼裝置100的分割部102而來的區塊分割資訊之語法決定處理之一例。
分割部102產生分割資訊樹,來作為區塊分割資訊的語法決定處理。前述分割資訊樹為分割資訊的樹狀結構,其包含有分別表示分割模式的複數個節點。
首先,分割部102會判定現節點是否正好在分歧判定之後(步驟S101)。在此,分割部102判定是正好在分歧判定之後時(步驟S101的Yes),則會以滿足條件(1)及條件(2)之任一方的方式,來選擇由現節點所表示的分割模式(步驟S102)。
條件(1)為如下的條件:其中一方之分歧A內的任意的子節點之分割粒度,與另一方之分歧B內的任意的子節點之分割粒度相等,或是大於其分割粒度。條件(2)為如下的條件:其中一方之分歧A內的任意的子節點之分割粒度,與另一方之分歧B內的任意的子節點之分割粒度相等,或是小於其分割粒度。
在此,若稱分割模式之總稱為分割資訊時,在分割資訊之樹狀結構的分歧部中,分割部102會以其中一方之分歧A內的任意子節點之分割粒度在另一方之分歧B內的任意子節點之分割粒度以上或者以下的方式,來選擇屬於分歧A側的現節點之分割模式。另,上述之分歧A例如是將現節點作為根節點來包含的子樹,而分歧B是將現節點之兄弟節點作為根節點來包含的子樹。
又,所謂分割粒度是相當於分割的個數,例如是將區塊分割成複數個子區塊時的前述子區塊之數量。具體上,4分割(QT)、3分割(TT)、2分割(BT)、以及非分裂(S)之分割粒度是分別表現為4、3、2及1。
[樹狀結構之例1] 圖13與圖14為顯示本實施型態中的分割資訊之樹狀結構之一例的圖。在圖13所示的樹狀結構,如圖13之(a)所示,各分歧是從分割模式是否為QT之條件分歧(即分歧判定)開始。在圖14所示的樹狀結構,各分歧是從分割模式是否為S之條件分歧開始。
在此,在圖13之樹狀結構中之最初的分歧後,如圖13之(b)所示具有2個節點,左側之節點為QT,右側之節點為S。QT之分割粒度為4,S以下之分歧內之各節點的分割粒度之最大值為3,所以左側之分歧內的全部節點之分割粒度,大於右側之分歧內的全部節點之分割粒度。即,包含QT節點的子樹內的全部節點之分割粒度,大於將S節點作為根節點來包含的子樹內的全部節點之分割粒度。
又,如圖13的(c)所示,S正下,即S之分歧後也有2個節點,左側的節點為NS,右側的節點為TT。進而,NS之分割粒度為1,TT以下的分歧內的各節點之分割粒度之最小值為2。因此,左側之分歧內的全部節點之分割粒度,小於右側之分歧內的全部節點之分割粒度。即,包含有NS節點的子樹內的全部節點之分割粒度,小於將TT節點作為根節點來包含的子樹內的全部節點之分割粒度。
另,於本揭示中,所謂規定的節點(表示分割模式的節點)以下的分歧,是將前述規定的節點作為根節點來包含的子樹。
於圖14所示的樹狀結構,也是在各分歧後的左側之分歧內的分割粒度,與右側之分歧內的分割粒度間存在著大小關係。在此,圖13及圖14中的Ver (Vertical)與Hor (Horizontal)分別表示水平方向與垂直方向的分割。又,在分割粒度大於4的分割模式存在時,也可依照圖12所示的流程圖,如圖13或圖14所示之例來產生樹狀結構。
針對圖13之樹狀結構做詳細說明。前述樹狀結構中,在BT之外也包含有TT。因此,以第2階層之分歧而言,即,以比判定分割模式是否為S的分歧更下方的節點而言,包含無分割、2分割與3分割。在此,以屬於分歧之左右兩側的節點之分法而言,存在有以下3種分法:(1) [分割粒度1]與[分割粒度2與分割粒度3]、(2) [分割粒度2]與[分割粒度1與分割粒度3],以及(3) [分割粒度3]與[分割粒度1與分割粒度2]。在(2)的情況下,因為比分割粒度2大(分割粒度3)的節點與小(分割粒度1)的節點會混合存在於其中一方的分歧內,所以列舉(1)或是(3)作為可選擇的候選。在圖13所示的樹狀結構之產生中,是選擇了(1)。另,上述第2階層之分歧或是節點為圖13中最上方的分歧或是節點(根節點)屬於第1階層時,屬於前述第1階層的下一個階層的分歧或是節點。又,第N階層(N為1以上的整數)的分歧或是節點為屬於從前述第1階層算起在下方第N個階層的分歧或是節點。第N階層之分歧或是節點於圖13以外的其他圖中,也是以同樣的意義來使用。
於圖14,以第2階層之分歧而言,即,以比判定分割模式是否為QT的分歧更下方的節點而言,包含有分割粒度為2、3、或4之3種類的節點。因此,與圖13同樣,3種分法之中僅有2種有效。
[樹狀結構之例2] 圖15與圖16為顯示實施形態2中的分割資訊之樹狀結構之另一例的圖。在圖15及圖16個別的樹狀結構中,各分歧之左側與右側個別的分歧(即子樹)內的分割粒度存在著大小關係,此與圖13及圖14個別的樹狀結構同樣。圖15及圖16個別的樹狀結構,是從圖13及圖14個別的樹狀結構中將TT與Ver做了交換的構造。當比起分割粒度,分割方向(水平方向及垂直方向)之相關性較高時,圖15及圖16所示的構造可能會有效。在圖15及圖16所示的構造中,在Ver分歧後的左右之節點皆為TT,且包含在左右個別的節點以下的分歧內的節點之分割粒度的最大值或者最小值是相等的。
[在樹的末端節點可選擇的要素] 當QT、BT及TT等分割模式之出現順序被限制時,在到達分割資訊樹之末端節點之後,可選擇的要素(即分割模式)也會被限制。例如,若各分割模式之出現順序被限制為QT、BT、TT的順序,則BT或TT之後不可進行QT之分割。
圖17是顯示限制分割模式之出現順序的樹狀結構之一例的圖。
分割部102也可在圖17的樹狀結構之HB、VB、HT、以及VT的4個末端節點中,以進一步分割區塊時不可選擇QT的方式,來決定前述欲分割的區塊之分割模式。另一方面,分割部103在QT之末端節點中,在區塊之進一步的分割中,可選擇QT、BT或者TT來作為前述區塊之分割模式。
另,在圖17之樹狀結構中,例如,表示HB、VB、HT、VT、QT以及NS之分割模式的分割資訊,會依照以圖17之樹狀結構為基準的語法,來分別產生「1000」、「1001」、「1010」、「1011」、「11」及「0」。又,也可將如此的分割資訊稱為語法。
[實施型態2之效果] 依據實施型態2,於各分歧部,包含在2個分歧內的分割模式之分割粒度之間會產生大小關係。例如,細緻的圖案則分割粒度會提高等,由於在分割粒度大的情況與分割粒度小的情況下發生機率容易產生偏差,因此以結果而言,有可能可以減低因分割資訊之可變長度編碼而來的編碼量。
[與其他態樣的組合] 也可將本實施型態與本揭示中的其他態樣之至少一部分組合並實施。又,也可將本實施型態之流程圖所記載的一部份的處理、裝置之一部分的構成、語法之一部分等與其他態樣組合並實施。
(實施型態3) 本實施型態中的編碼裝置100與實施型態1同樣,具有圖1所示的構成。又,本實施型態中的編碼裝置100之分割部102與實施型態2同樣,相對於實施型態1具有附加的功能或是替代的功能。
[編碼裝置之分割部的處理流程] 圖18是流程圖,顯示實施形態3中由編碼裝置100的分割部102而來的區塊分割資訊之語法決定處理之一例。
分割部102如圖18之流程圖所示,於實施型態2之語法決定處理中,會進而以節點之分割粒度相對於樹狀結構之深度方向依升序或是降序排列的方式來選擇分割模式。
具體上,分割部102首先會判定現節點是否正好在分歧判定之後(步驟S101)。在此,若分割部102判定是正好在分歧判定之後(步驟S101的Yes),會以滿足條件(1)及(2)之任一方的方式,來選擇由現節點所示的分割模式之至少1個候選(步驟S102a)。條件(1)及(2)分別與圖12之流程圖所示的條件(1)及(2)相同。
接著,分割部102於樹狀結構,將比現節點更上位的階層之各節點所示的分割模式之分割粒度中最小的分割粒度特定成N1。並且,分割部102從步驟S102a中所選擇的至少1個分割模式的候選之中,選擇N1以下之具有最大分割粒度的分割模式(步驟S103)。
[樹狀結構之例] 圖19與圖20是顯示本實施形態中的分割資訊之樹狀結構之一例的圖。圖19所示的樹狀結構如圖19的(a)所示,各節點之分割模式是配置成使分割粒度呈降序。又,在圖20所示的樹狀結構中,各節點之分割模式是配置成使分割粒度呈升序。如圖19的(b)及(c)所示,在各分歧部中,其中一方之分歧內全部的節點之分割粒度,比起另一方之分歧內全部的節點之分割粒度,會呈以下任一性質:(1)較大或是相等;或者(2)較小或是相等,且前述性質與實施型態2之樹狀結構同樣。
即,本實施型態之樹狀結構於以下的點會與實施型態2之樹狀結構相異。前述點為:像圖19所示的樹狀結構一樣,藉由各分歧部之分歧判定所決定的子節點之分割粒度,是依照上位階層至下位階層的順序而越來越小;或是,像圖20所示的樹狀結構一樣,藉由各分歧部之分歧判定所決定的子節點之分割粒度,是依照上位階層至下位階層的順序而越來越大。
在此,本實施型態之樹狀結構中,沒有必要全部的子節點之分割粒度皆依照上位階層至下位階層的順序而越來越小(或是越來越大),也可僅有一部分的子節點之分割粒度是依照上位階層至下位階層的順序而越來越小(或是越來越大)。
換言之,在本實施型態之樹狀結構中,如圖19之例所示,以在任意的分歧部之分歧判定的分割模式而言,在不選擇Ver而是選擇表示分割數的分割模式時,會選擇只比上位階層之分割模式的分割粒度小1個分割粒度的分割模式(例如是QT、TT、BT或NS等)。即,在前述任意的分歧部之上一位階層的分歧部中之比分歧判定相關的分割模式之分割粒度(例如QT則為4,TT則為3,BT則為2,NS則為1)小1個分割粒度的分割模式,會被用作前述任意的分歧部之分歧判定的節點。圖20之例中,在上一位階層的分歧部中之比分歧判定相關的分割粒度大1個分割粒度的分割模式,會被用作前述任意的分歧部之分歧判定的節點。
或者是,再換言之,在本實施型態之樹狀結構中,如圖19之例所示,是以藉由在任意的分歧部中之分歧判定來決定分割數的子節點之分割粒度依照上位階層至下位階層的順序而越來越小的方式,來選擇前述任意的分歧部中的分割模式。而在圖20之例,則是以前述子節點之分割粒度依照上位階層至下位階層的順序而越來越大的方式,來選擇前述任意的分歧部中的分割模式。
[實施型態3之效果] 依據實施型態3,因為分割粒度會在樹狀結構之深度方向上連續地變化,所以父節點與自節點(即子節點)的分割模式之發生機率的相關性會升高,分割資訊之可變長度編碼的效率有可能提升。
[與其他態樣的組合] 也可將本實施型態與本揭示中的其他態樣之至少一部分組合並實施。又,也可將本實施型態之流程圖所記載的一部分的處理、裝置之一部分的構成、語法之一部分等與其他態樣組合並實施。
(實施型態4) 本實施型態中的編碼裝置100與實施型態1同樣,具有圖1所示的構成。又,本實施型態中的編碼裝置100之分割部102與實施型態2或3同樣,相對於實施型態1具有附加的功能或是替代的功能。
[編碼裝置之分割部的處理流程] 圖21是流程圖,顯示實施型態4中由編碼裝置100的分割部102而來的區塊分割資訊之語法決定處理之一例。
本實施型態中的語法決定處理如圖21之流程圖所示,可根據規定的編碼參數來變更分割資訊樹之屬性,此點與實施型態2及3之語法決定處理相異。
具體上,分割部102首先會根據規定的編碼參數,來選擇分割資訊樹之屬性(步驟S100)。並且,分割部102會判定現節點是否正好在分歧判定之後(步驟S101)。在此,分割部102判定是正好在分歧判定之後時(步驟S101的Yes),會根據在步驟S100所選擇的分割資訊樹之屬性,來選擇條件(1)及條件(2)之中的任一方。並且,分割部102會選擇由現節點所表示的分割模式,來滿足前述已選擇的條件(步驟S102b)。另,條件(1)及(2)分別與圖12之流程圖所示的條件(1)及(2)相同。
在此,作為上述規定的編碼參數,有圖片類型及QP (量化參數)等。例如,在幀內編碼之切片或者圖片中,基準區塊有分割成尺寸小的區塊之傾向。因此,分割部102在步驟S100,會針對幀內編碼之切片或者圖片,選擇圖13所示的屬性之分割資訊樹,即,選擇從分割粒度大的QT開始進行分歧判定的屬性之分割資訊樹。另一方面,在幀間編碼之切片或者圖片中,比起幀內編碼有分割數較少的傾向。因此,分割部102在步驟S100,會針對幀間編碼之切片或者圖片,選擇圖14所示的屬性之分割資訊樹,即,選擇從分割粒度小的S開始進行分歧判定的屬性之分割資訊樹。藉此,可切換分割資訊樹之屬性,即分割資訊樹。
分割資訊樹之屬性的切換,可實施於將序列、切片、圖片,或者切片分割後的單位(CTU等)等。編碼裝置100可將表示有效的分割資訊樹之屬性的資訊,編碼成切片或是圖片等的標頭(Header)資訊,或者,也可事先與圖片類型等相關聯而不編碼前述資訊。
另,分割部102不只是根據規定的編碼參數,也可根據其他參數來選擇分割資訊樹之屬性,或者,也可代替規定的編碼參數,僅根據其他參數來選擇。其他參數例如也可為分割模式之發生機率。此情況下,其他參數具體為:編碼完畢之圖片中的分割模式之發生機率P1;或是,在實施2次(pass)編碼時,在第1次(pass)取得的分割模式之發生機率P2等。在此,當其他參數是發生機率P1時,解碼裝置200可取得解碼完畢的圖片中的分割模式之發生機率,並決定分割資訊樹之屬性。又,編碼裝置100也可將決定分割資訊樹用的資訊編碼為標頭資訊。
[實施型態4之效果] 依據實施型態4,藉由切換與分割粒度之大小傾向對應的分割資訊樹,而選擇適合於分割資訊之發生機率的樹,因此有可能提升分割資訊之可變長度編碼的效率。
[與其他態樣的組合] 也可將本實施型態與本揭示中的其他態樣之至少一部分組合並實施。又,也可將本實施型態之流程圖所記載的一部分的處理、裝置之一部分的構成、語法之一部分等與其他態樣組合並實施。
(實施型態5) 本實施型態中的編碼裝置100與實施型態1同樣具有圖1所示的構成。又,本實施型態中的編碼裝置100之分割部102與實施型態2~4同樣,相對於實施型態1具有附加的功能或是替代的功能。
[編碼裝置之分割部的處理流程] 圖22是流程圖,顯示實施型態5中由編碼裝置100的分割部102而來的區塊分割資訊之語法決定處理之一例。
本實施型態中的語法決定處理如圖22之流程圖所示,針對可選擇的屬性之分割資訊樹中出現的全部要素,設定發生機率之初始值,此點與實施型態4相異。另,上述的要素即分割資訊之要素,例如是分割模式。
具體上,分割部102首先會針對可選擇的屬性之分割資訊樹中使用的分割資訊的全部要素,設定發生機率之初始值(步驟S99)。例如,當藉由分割資訊樹所使用的分割資訊之要素相異時,會存在著不使用於特定的分割資訊樹的分割資訊之要素。然而,分割部102對如此的分割資訊之要素也會設定初始值。
並且,分割部102與實施型態4同樣,會實行步驟S100、S101及S102b之處理。
[實施型態5之效果] 依據實施型態5,因為針對會出現的全部分割資訊之要素設定發生機率之初始值,所以可解決在算術編碼及算術解碼時初始值不固定而可能誤動作的問題。
[與其他態樣的組合] 也可將本實施型態與本揭示中的其他態樣之至少一部分組合並實施。又,也可將本實施型態之流程圖所記載的一部分的處理、裝置之一部分的構成、語法之一部分等與其他態樣組合並實施。
(實施型態6) 本實施型態中的解碼裝置200與實施型態1同樣,具有圖10所示的構成。又,本實施型態中的解碼裝置200之熵解碼部202,相對於實施型態1具有附加的功能或是替代的功能。
[解碼裝置之熵解碼部的處理流程] 圖23是流程圖,顯示實施型態6中由解碼裝置200的熵解碼部202而來的區塊分割資訊之語法解碼處理之一例。
熵解碼部202在語法解碼處理中,首先會特定出在解碼對象之基準區塊(例如是CTU等)中有效的分割資訊樹之屬性(步驟S201)。接著,熵解碼部202會根據特定出的屬性之分割資訊樹,來將基準區塊之分割資訊解碼(步驟S202)。即,熵解碼部202會將針對基準區塊即解碼對象區塊而產生並且被可變長度編碼的分割資訊,做可變長度解碼。並且,熵解碼部202會依照語法來特定出藉由前述可變長度解碼過的分割資訊所表示的分割模式,其中前述語法是以在步驟S201中特定出的屬性之分割資訊樹為基準。
分割資訊樹例如是藉由實施型態2至實施型態5為止之各型態所產生的樹之中的任一者。又,在分割資訊樹之屬性被固定的情況下,熵解碼部202也可總是使用預設(default)的分割資訊樹。又,針對分割資訊之要素的發生機率之初始值,是以和編碼時同樣的方法來設定。
又,當用以決定分割資訊樹的資訊被編碼時,熵解碼部202會將該資訊解碼,並依照所解碼的前述資訊,來選擇或產生分割資訊樹。並且,熵解碼部202也可依照前述選擇或產生的分割資訊樹,來將分割資訊解碼。
另,包含在分割資訊樹的分割資訊之個別的要素,也可藉由算術編碼等來做可變長度編碼。此情況下,熵解碼部202會針對每個分割資訊之要素,將根據規定的可變長度編碼方法而可變長度編碼過的前述要素,根據對應於前述規定的可變長度編碼方法的可變長度解碼方法,來做可變長度解碼。
[實施型態6之效果] 依據實施型態6,可將藉由實施型態2至實施型態5中的編碼方法所編碼的分割資訊適宜地解碼。
[與其他態樣的組合] 也可將本實施型態與本揭示中的其他態樣之至少一部分組合並實施。又,也可將本實施型態之流程圖所記載的一部分的處理、裝置之一部分的構成、語法之一部分等與其他態樣組合並實施。
[實施型態2~6之補充說明] 編碼對象區塊之分割資訊例如也可包含:將藉由複數個分割模式來表現的樹狀結構之屬性予以表示的資訊、以及依照該樹狀結構所產生的語法。在此,所謂將樹狀結構之屬性予以表示的資訊,作為一例,可以是指定構成樹狀結構的分割模式之配置或順序等的資訊,也可以是表示在規定的複數個樹狀結構之中要使用哪個樹狀結構的資訊。
在樹狀結構中的複數個分割模式,例如也可包含「2分割(BT)、3分割(TT)、4分割(QT)、表示進行更進一步分割的分裂(S)、表示不進行更進一步分割的非分裂(NS)、朝垂直方向的分割(Ver),以及朝水平方向的分割(Hor)」。此情況下,使用了全部的分割模式的樹狀結構之語法所能表現的區塊分割形狀(包含無分割)之種類,作為一例,是「4分割、垂直3分割、水平3分割、垂直2分割、水平2分割,以及無分割」之至少6種類。在實施型態2~實施型態6,雖已揭示分別在該等區塊分割形狀中,將前述區塊形狀之分割模式僅使用1次或2次來表現的樹狀結構,但不限於該等例子。例如將複數個分割模式分別地各使用複數次來構成樹狀結構,藉此可表現6種類以上的區塊分割形狀。此情況下,如實施型態2,也可預先決定在從特定的分割模式進一步進行分割時可選擇的分割模式。
另,於本揭示中「分歧A內的子節點」例如是包含「不只直接屬於分歧A的子節點,還有位於比該子節點之階層更下方的階層、且屬於分岐A之延伸上的節點」。
又,為了滿足實施型態2~實施型態6中的樹狀結構之條件,而藉由在最上位階層的分歧判定來決定分割數的子節點之分割模式,也可為最大的或者最小的分割粒度之分割模式。即,分割部102及熵解碼部202例如亦可將可選擇的分割模式中最大粒度的分割模式(以QT為一例)或最小粒度的分割模式(以NS為一例)的任一方,選擇成在最上位階層的分歧判定中使用的分割模式。
在此,當使用包含無分割在內僅4種類以下的分割模式時,例如在使用「4分割、垂直2分割、水平2分割、無分割」之分割模式來產生編碼對象區塊之分割資訊時,可藉由分割模式所表現的樹狀結構之樣式較少。另一方面,如實施型態2~實施型態6,例如當使用包含無分割在內6種類以上的分割模式時,在使用「4分割、垂直3分割、水平3分割、垂直2分割、水平2分割、以及無分割」之分割模式作為一例的情況下,為了表現樹狀結構而可選擇的分割模式數較多,可表現的樹狀結構之樣式也較多。在此,本發明者等人由幾個樹狀結構之中,看出了因為編碼對象區塊等之性質,會造成可變長度編碼中的編碼量增加的課題,且該課題隨著樹狀結構之表現樣式增加而更顯著。即,僅使用4種類以下的分割模式時,可在一定程度上必然地選擇樹狀結構。相對於此,如實施型態2~6,例如在使用6種類以上的分割模式的情況下,從多數的樣式中選擇樹狀結構及分割模式的自由度較高。因此,選擇到有可能促進編碼量增加的分割模式來表現出樹狀結構,因而使最後的編碼效率低落的概率變高。在此,實施型態2~5個別的區塊分割資訊之語法產生處理,具有可抑制可變長度編碼中的編碼量之增加這種可顯著改善習知中未認知的課題的新技術性意義。
[實施型態2~6之安裝例] 圖24A是方塊圖,顯示實施型態2~5中的編碼裝置之安裝例。編碼裝置1a具備有電路2a及記憶體3a。例如,圖1所示的編碼裝置100之複數個構成要件,是藉由圖24A所示的電路2a及記憶體3a而安裝。
電路2a是進行資訊處理的電路,且是可存取於記憶體3a的電路。例如,電路2a為將動態圖像編碼之專用或者通用的電子電路。電路2a也可為有如CPU的處理器。又,電路2a也可為複數個電子電路之集合體。又例如,電路2a也可發揮在圖1等所示的編碼裝置100的複數個構成要素之中,記憶資訊用的構成要素以外的複數個構成要素之功用。
記憶體3a為記憶電路2a編碼動態圖像用的資訊之通用或專用的記憶體。記憶體3a可為電子電路,也可連接於電路2a。又,記憶體3a也可包含在電路2a中。又,記憶體3a也可為複數個電子電路之集合體。又,記憶體3a可為磁碟或者光碟等,也可呈現為儲存器或者記錄媒體等。又,記憶體3a可為非揮發性記憶體,也可為揮發性記憶體。
例如,記憶體3a中,可記憶欲編碼的動態圖像,也可記憶與被編碼的動態圖像對應的位元串。又,記憶體3a中,也可記憶電路2a編碼動態圖像用的程式。
又例如,記憶體3a也可發揮在圖1所示的編碼裝置100的複數個構成要素之中,記憶資訊用的構成要素之功用。具體上,記憶體3a也可發揮在圖1所示的區塊記憶體118以及幀記憶體122之功用。更具體而言,記憶體3a中也可記憶處理完畢子區塊、處理完畢區塊以及處理完畢圖片等。
另,在編碼裝置100中,可不必將圖1所示的複數個構成要素全部安裝,也可不必將上述的複數個處理全部進行。圖1所示的複數個構成要素之一部份也可包含在其他的裝置,且上述的複數個處理之一部分也可由其他的裝置來執行。
圖24B是流程圖,顯示具備有電路2a及記憶體3a的編碼裝置1a之處理動作。
電路2a會使用記憶體3a,首先從複數個分割模式,選擇編碼對象區塊之分割模式(步驟S11a)。其次,電路2a會依照語法來產生表示針對編碼對象區塊而選擇的分割模式之分割資訊,其中前述語法是以將複數個分割模式作為複數個節點來包含的樹狀結構為基準(步驟S12a)。於此,在該樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是:(i) 將第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者 (ii) 第2子樹內全部的節點之個別節點的分割粒度以下的大小。
例如,電路2a會藉由針對樹狀結構之各節點來選擇分割模式,而產生編碼對象區塊之分割資訊之產生所使用的上述樹狀結構。並且,在該樹狀結構之產生中,電路2a會以將選擇對象之節點作為根節點來包含的第1子樹內任意的節點之分割粒度大於第2子樹內任意的節點之分割粒度的方式,針對選擇對象之節點來選擇分割模式。又,前述複數個分割模式也可包含有將區塊3分割的分割模式。具體上,電路2a會如實施型態2,產生圖13~17所示的樹狀結構,且依照以前述樹狀結構為基準的語法,來產生表示針對編碼對象區塊而選擇的分割模式之分割資訊。
藉此,樹狀結構之各父節點會被分歧成分割粒度大的子樹及分割粒度小的子樹,而可抑制在子樹內大分割粒度與小分割粒度混合存在的情況。因此,可使藉由前述樹狀結構所表示的各區塊之分割資訊的發生機率具有偏差。結果,有可能使因分割資訊之可變長度編碼而來的編碼量可減低。
又,電路2a在樹狀結構之產生中,也可以分割粒度隨著樹狀結構之階層增加而單調增加或是單調減少的方式,針對各節點來選擇分割模式。具體上,電路2a會如實施型態3,產生圖19或圖20所示的樹狀結構。
藉此,分割粒度會在樹狀結構之深度方向上連續地變化。因此,父節點與子節點中的分割資訊之發生機率的相關性會升高,分割資訊之可變長度編碼的效率有可能提升。
又,也可以是電路2a進而從複數個樹狀結構中,根據規定的編碼參數來選擇任一個樹狀結構,藉此切換編碼對象區塊之分割資訊之產生所使用的樹狀結構。具體上,電路2a會如實施型態4,根據圖片類型或是QP等的編碼參數來切換樹狀結構。
藉此,可使用適合於分割資訊之發生機率的樹狀結構,結果分割資訊之可變長度編碼的效率有可能會提升。
又,也可是電路2a進而針對包含在複數個樹狀結構中全部的分割模式之個別模式,設定該分割模式之發生機率的初始值。具體上,電路2a會如實施型態5,針對分割資訊之全部的要素,設定發生機率之初始值。
藉此,可抑制在分割資訊之可變長度編碼(具體為算術編碼)中,初始值不固定而誤動作的情況。
圖24C是方塊圖,顯示實施型態中6的解碼裝置之安裝例。解碼裝置1b具備有電路2b及記憶體3b。例如,圖10所示的解碼裝置200之複數個構成要素,是藉由圖24C所示的電路2b及記憶體3b來安裝。
電路2b是進行資訊處理的電路,且是可存取於記憶體3b的電路。例如,電路2b為將動態圖像解碼之通用或專用的電子電路。電路2b也可為有如CPU的處理器。又,電路2b也可為複數個電子電路之集合體。又例如,電路2b也可發揮在圖10所示的解碼裝置200的複數個構成要素之中,記憶資訊用的構成要素以外的複數個構成要素之功用。
記憶體3b,為記憶電路2b解碼動態圖像用的資訊之通用或專用的記憶體。記憶體3b可為電子電路,也可連接於電路2b。又,記憶體3b也可包含在電路2b中。又,記憶體3b也可為複數個電子電路之集合體。又,記憶體3b可為磁碟或者光碟等,也可呈現為儲存器或記錄媒體等。又,記憶體3b可為非揮發性記憶體,也可為揮發性記憶體。
例如,記憶體3b中,可記憶與被編碼的動態圖像對應的位元串,也可記憶與被解碼的位元串對應的動態圖像。又,記憶體3b中,也可記憶電路2b解碼動態圖像用的程式。
又例如,記憶體3b也可發揮在圖10所示的解碼裝置200的複數個構成要素之中,記憶資訊用的構成要素之功用。具體上,記憶體3b也可發揮在圖10所示的區塊記憶體210以及幀記憶體214之功用。更具體而言,記憶體3b中,也可記憶處理完畢的子區塊、處理完畢的區塊,以及處理完畢的圖片等。
另,在解碼裝置200中,可不必將圖10所示的複數個構成要素全部安裝,也可不必將上述的複數個處理全部執行。圖10所示的複數個構成要素之一部份,也可包含在其他的裝置,且上述的複數個處理之一部分,也可由其他的裝置來執行。
圖24D是流程圖,顯示具備有電路2b及記憶體3b的解碼裝置1b之處理動作。
電路2b會使用記憶體3b,首先將複數個分割模式作為複數個節點來包含,且特定出在解碼對象區塊中有效的樹狀結構之屬性(步驟S11b)。其次,電路2b會依照以特定出的屬性之樹狀結構為基準的語法,來特定出針對解碼對象區塊而產生的分割資訊所表示的分割模式(步驟S12b)。於此,在前述樹狀結構中,當相對各父節點具有第1子節點與第2子節點時,將第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是:(i) 將第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者(ii) 第2子樹內全部的節點之個別節點的分割粒度以下的大小。
例如,前述樹狀結構是藉由針對樹狀結構之各節點來選擇分割模式而產生,且在前述樹狀結構中,是以將選擇對象之節點作為根節點來包含的第1子樹內任意的節點之分割粒度大於第2子樹內任意的節點之分割粒度的方式,針對前述選擇對象之節點來選擇分割模式。又,該等複數個分割模式包含有將區塊3分割的分割模式。具體上,電路2a會特定出實施型態2中圖13~圖17所示的樹狀結構之屬性,且依照以前述屬性之樹狀結構為基準的語法來特定出分割模式。
藉此,被特定的屬性之樹狀結構之各父節點會被分歧成分割粒度大的子樹及分割粒度小的子樹,而可抑制在子樹內大分割粒度與小分割粒度混合存在的情況。因此,可使藉由該樹狀結構所表示的各區塊之分割資訊的發生機率具有偏差。結果,可將依照以前述樹狀結構為基準的語法而產生、且經過可變長度編碼之編碼量減低的分割資訊適宜地解碼。
又,在樹狀結構中,也可以分割粒度隨著前述樹狀結構之階層增加而單調增加或是單調減少的方式,針對各節點來選擇分割模式。具體上,電路2b會特定出實施型態3中的圖19或圖20所示的樹狀結構之屬性。
藉此,分割粒度會在樹狀結構之深度方向上連續地變化。因此,父節點與子節點中的分割資訊之發生機率之相關性會提高。結果,可將依照以前述樹狀結構為基準的語法而產生、且經過可變長度編碼之高編碼效率的分割資訊適宜地解碼。
又,也可以是電路2b進而從複數個樹狀結構中,根據規定的編碼參數來選擇任一個樹狀結構,藉此切換解碼對象區塊之分割模式之特定所使用的樹狀結構。具體上,電路2b會如實施型態4,根據圖片類型或是QP等的編碼參數來切換樹狀結構。
藉此,可使用適合於分割資訊之發生機率的樹狀結構,結果可將高編碼效率的分割資訊適宜地解碼。
又,也可是電路2b進而針對包含在複數個樹狀結構中全部的分割模式之個別模式,設定該分割模式之發生機率的初始值。具體上,電路2b會如實施型態5,針對分割資訊之全部的要素,設定發生機率之初始值。
藉此,可抑制在分割資訊之可變長度解碼(具體為算術解碼)中,初始值不固定而誤動作的情況。
另,上述各實施型態中的第1子樹內(即分歧A內)之節點數可為1個,也可為複數個。同樣,第2子樹內(即分歧B內)之節點數可為1個,也可為複數個。
[補充] 上述各實施型態中的編碼裝置及解碼裝置,可分別作為圖像編碼裝置以及圖像解碼裝置來利用,也可分別作為動態圖像編碼裝置以及動態圖像解碼裝置來利用。
又,在上述各實施型態中,各構成要素是由專用的硬體所構成,或藉由執行適合於各構成要素的軟體程式來實現皆可。各構成要素也可藉由CPU或者處理器等程式執行部讀出並執行記錄在硬體或者半導體記憶體等記錄媒體的軟體程式而實現。
具體上,編碼裝置及解碼裝置亦可分別包含:處理電路(Processing Circuitry);以及記憶裝置(Storage),電連接於該處理電路,且可從該處理電路做存取。
處理電路包含有專用的硬體及程式執行部之至少一者,且使用記憶裝置來執行處理。又,記憶裝置在處理電路包含程式執行部時,會記憶藉由該程式執行部所執行的軟體程式。
在此,實現上述各實施型態之編碼裝置及解碼裝置等的軟體是如下的程式。
即,前述程式會使電腦執行依照圖5B、圖5D、圖12、圖18、圖21~圖23、圖20B及圖20D中任一者所示的流程圖之處理。
又,各構成要素如上述亦可為電路。該等電路可構成為1個整體的電路,也可為分別不同的電路。又,各構成要素可由通用的處理器來實現,也可由專用的處理器來實現。
又,可由別的構成要素來執行特定的構成要素所執行的處理。又,執行處理的順序可變更,也可複數個處理並行執行。又,編碼解碼裝置也可包含有編碼裝置及解碼裝置。
說明中所用的第1及第2等序數可適宜替換。又,對於構成要素等,可另再賦予序數,也可去除序數。
以上,已針對編碼裝置及解碼裝置之態樣基於各實施型態來做說明,然而編碼裝置及解碼裝置之態樣不限定於該等實施型態。在不脫離本揭示之旨趣的情況下,所屬技術領域中具有通常知識者將想到的各種變形施於實施型態者、以及將不同實施形態中的構成要素組合建構的形態,也可包含在編碼裝置及解碼裝置之態樣的範圍內。
(實施形態7) 在以上之各實施形態中,功能區塊的每一個通常可藉由MPU及記憶體等來實現。又,功能區塊的每一個所進行的處理,通常可藉由處理器等程式執行部讀出ROM等記錄媒體所記錄的軟體(程式)來執行而予以實現。該軟體可藉由下載等來分發,也可記錄在半導體記憶體等記錄媒體來分發。另,將各功能區塊藉由硬體(專用電路)來實現當然也可以。
又,在各實施形態中所說明的處理可藉由使用單一裝置(系統)進行集中處理來實現,或者也可藉由使用複數個裝置進行分散處理來實現。又,執行上述程式的處理器可為單數個,也可為複數個。即,可進行集中處理,或者也可進行分散處理。
本揭示之態樣並不限於以上的實施例,可做各種變更,其等變更也包括在本揭示的態樣之範圍內。
進而在此,說明在上述各實施形態中所示之動態圖像編碼方法(圖像編碼方法)或動態圖像解碼方法(圖像解碼方法)的應用例及使用前述應用例之系統。該系統之特徵在於具有使用圖像編碼方法之圖像編碼裝置、使用圖像解碼方法之圖像解碼裝置、及具備兩者之圖像編碼解碼裝置。針對系統中的其他構成,可視情況適當地變更。
[使用例] 圖25係顯示實現內容(contents)發布服務之內容供給系統ex100之整體構成圖。將通訊服務之提供區域分割成所期望之大小,在各細胞(cell)內分別設置有為固定無線台之基地台ex106、ex107、ex108、ex109、ex110。
在前述內容供給系統ex100中,經由網際網路服務提供者ex102或通訊網ex104、及基地台ex106至ex110,而將電腦ex111、遊戲機ex112、攝像機ex113、家電ex114、及智慧型手機ex115等各種機器連接於網際網路ex101。該內容供給系統ex100亦可構成為組合上述任一要件而連接。也可不經由為固定無線台之基地台ex106至ex110,而是使各機器經由電話網或者近距離無線等直接或間接地互相連接。又,串流伺服器ex103是經由網際網路ex101等而與電腦ex111、遊戲機ex112、攝像機ex113、家電ex114、及智慧型手機ex115等各機器連接。又,串流伺服器ex103是經由衛星ex116而與飛機ex117內之熱點內的終端等連接。
另,也可使用無線存取點或熱點等來替代基地台ex106至ex110。又,串流伺服器ex103也可不經由網際網路ex101或者網際網路服務提供者ex102而直接與通訊網ex104連接,也可不經由衛星ex116而直接與飛機ex117連接。
攝像機ex113是數位相機等可進行靜止圖攝影及動態圖攝影之機器。又,智慧型手機ex115一般是指對應於2G、3G、3.9G、4G、接著是今後被稱為5G的行動通訊系統之方式的智慧型話機、行動電話機、或者PHS(Personal Handyphone System)等。
家電ex118是包含在冰箱或者家用燃料電池熱電共生系統的機器等。
在內容供給系統ex100中,藉由讓具有攝影功能的終端透過基地台ex106等而連接到串流伺服器ex103,可進行現場直播等。在現場直播中,終端(電腦ex111、遊戲機ex112、攝像機ex113、家電ex114、智慧型手機ex115、及飛機ex117內之終端等)是將以如下方式所得到的資料發送到串流伺服器ex103:對於用戶使用該終端所攝影的靜止圖或動態圖內容,進行在上述各實施形態所說明的編碼處理,且將藉由編碼所得到的影像資料與對應於影像的聲音經編碼後的聲音資料進行多工。即,各終端是作為本揭示之一態樣的圖像編碼裝置而發揮功能。
另一方面,串流伺服器ex103是將對有請求的客戶端發送的內容資料進行串流發布。客戶端是指可將上述經過編碼處理的資料進行解碼之電腦ex111、遊戲機ex112、攝像機ex113、家電ex114、智慧型手機ex115、或者飛機ex117內的終端等。已接收到所發布的資料的各機器將接收到的資料進行解碼處理後再生。即,各機器是作為本揭示之一態樣的圖像解碼裝置而發揮功能。
[分散處理] 又,串流伺服器ex103也可為複數個伺服器或者是複數個電腦,將資料分散處理或記錄並發布。例如,串流伺服器ex103也可藉由CDN(Contents Delivery Network)來實現,透過連接分散在世界各地的多數邊緣伺服器(edge server)彼此之間的網路來實現內容發布。在CDN中是因應客戶端而動態地分配物理上較接近的邊緣伺服器。然後,內容被該邊緣伺服器快取及發布,藉此可減少延遲的情況。又,在發生某些錯誤時或者因流量增加等而使通訊狀態改變時,可以複數個邊緣伺服器分散處理,或者將發布主體切換到其他邊緣伺服器,而繞過已發生障礙的網路部分來持續進行發布,因此可實現高速且穩定的發布。
又,不只是發布本身的分散處理,也可讓所攝影的資料的編碼處理在各終端進行,也可在伺服器側進行,也可互相分擔來進行。舉一例來說,一般在編碼處理中是進行2次處理迴路。第1次的迴路會檢測以幀或者場景為單位的圖像之複雜度或編碼量。又,第2次的迴路會進行維持畫質並使編碼效率提高的處理。例如,藉由使終端進行第1次的編碼處理,並使已收到內容的伺服器側進行第2次的編碼處理,可一邊減少在各終端的處理負載,一邊提高內容的品質及效率。此時,若有幾乎即時接收且解碼的請求時,由於也可以其他終端來接收且再生終端已進行之第一次的編碼完畢資料,因此能達到更靈活的即時發布。
舉另一例來說,攝像機ex113等是從圖像進行特徵量擷取,將有關於特徵量的資料壓縮成詮釋資料(metadata)而發送到伺服器。伺服器是因應圖像的意義來進行壓縮,例如從特徵量來判斷目標(object)的重要性而切換量化精度等。特徵量資料對於伺服器上之再次壓縮時的移動向量預測之精度及效率提升特別有效。又,也可在終端進行VLC(可變長度編碼)等之簡易性編碼,在伺服器進行CABAC(前後文適應性二進位算術編碼)等處理負載大的編碼。
進而,以其他例來說,在體育場、購物商場、或者工廠等之中,會有藉由複數個終端而拍攝到幾乎相同的場景之複數個影像資料存在的情況。在該時候,使用進行過拍攝的複數個終端、及因應需要而未拍攝的其他終端及伺服器,以諸如GOP(Group of Picture)單位、圖片單位、或者將圖片分割之圖塊單位等,分別分配編碼處理來進行分散處理。藉此,可減少延遲,實現更佳的即時性。
又,由於複數個影像資料為幾乎相同的場景,因此也可在伺服器進行管理及/或指示,以相互參考各終端所拍攝的影像資料。或者,也可使伺服器接收來自各終端的編碼完畢資料,在複數個資料之間變更參考關係,或者將圖片本身進行補正或交換,來重新進行編碼。藉此,可產生一個一個資料的品質及效率都提高的串流。
又,伺服器也可先進行將影像資料的編碼方式變更的轉碼,再發布影像資料。例如,伺服器也可將MPEG系的編碼方式轉換成VP系,也可將H.264轉換成H.265。
如此,編碼處理可藉由終端或者是1個以上的伺服器來進行。因此,在下文中,進行處理的主體雖然是採用「伺服器」或者是「終端」等的記述,但也可讓伺服器所進行的處理的一部分或者全部在終端進行,也可讓終端所進行的處理的一部分或者全部在伺服器進行。又,有關於該等,針對解碼處理也是同樣。
[3D、多角度] 近年來,將彼此幾乎同步的複數個攝像機ex113及/或智慧型手機ex115等之終端所攝影的不同場景、或從不同角度拍攝相同場景的圖像或影像整合來利用的情形也變多了。以各終端所拍攝的影像是根據另外取得的終端間之相對的位置關係、或者影像所包含的特徵點為一致的區域等來整合。
伺服器不只將二維的動態圖像進行編碼,還可根據動態圖像的場景解析等,而自動或者是在用戶所指定的時刻,將靜止圖進行編碼,再發送到接收終端。伺服器進而在可取得攝影終端之間的相對的位置關係時,不只是根據二維的動態圖像,還可根據從不同角度對相同場景拍攝的影像,而產生該場景的三維形狀。另,伺服器可將藉由點雲(point cloud)等所產生的三維資料另外進行編碼,也可根據使用三維資料而辨識或追蹤人物或目標的結果,從以複數個終端拍攝的影像中選擇、或再構成並產生要發送到接收終端的影像。
如此,用戶可任意選擇對應於各攝影終端的各影像來觀賞場景,也可觀賞從三維資料切出任意視點的影像之內容,其中前述三維資料是使用複數個圖像或影像而再構成。進而,與影像同樣,聲音也可從複數個不同的角度收音,令伺服器配合影像,將來自特定角度或空間的聲音和影像進行多工,之後再發送。
又,近年來,Virtual Reality(VR/虛擬實境)及Augmented Reality(AR/擴增實境)等使現實世界及虛擬世界相對應的內容也漸漸普及了。在VR圖像的情況,伺服器可分別做出右眼用及左眼用的視點圖像,藉由Multi-View Coding(MVC/多視角編碼)等,進行在各視點影像之間容許參考的編碼,也可不互相參考而作為獨立的串流來進行編碼。在解碼獨立的串流時,可使其互相同步而再生,以因應用戶的視點而重現虛擬的三維空間。
在AR圖像的情況,伺服器會根據三維的位置或者用戶視點的移動,而將虛擬空間上的虛擬物體資訊重疊在現實空間的攝像機資訊。解碼裝置也可取得或者保持虛擬物體資訊及三維資料,並因應用戶視點的移動而產生二維圖像,且藉由平順地連結該等來作成重疊資料。或者,解碼裝置也可在虛擬物體資訊的請求指令外,還將用戶視點的移動也發送到伺服器,伺服器配合接收到的視點移動而從保持在伺服器的三維資料中作成重疊資料,且將重疊資料進行編碼,再發布到解碼裝置。另,也可是重疊資料除了RGB以外還具有顯示穿透度的α值,伺服器將從三維資料作成的目標以外的部分之α值設定為0等,且在該部分為穿透的狀態下進行編碼。或者,伺服器也可產生資料,前述資料如同色度鍵(Chroma key),是將規定值之RGB值設定為背景,且將目標以外的部分設成背景色。
同樣,被發布的資料的解碼處理可在客戶端之各終端進行,也可在伺服器側進行,或者也可相互分擔進行。以一例來說,也可是某終端一旦將接收請求送到伺服器,便以其他終端機接收因應前述請求的內容並進行解碼處理,且解碼完畢的訊號會發送到具有顯示器的裝置。藉由不依賴可通訊的終端本身的性能而分散處理並選擇適合的內容,可再生畫質佳的資料。又,以另一例來說,也可一邊在TV等接收大尺寸的圖像資料,一邊將圖片分割後的圖塊等一部分的區域在觀眾的個人終端進行解碼而顯示。藉此,可共享整體圖像,並可在手邊確認本身的負責領域或者想更加詳細確認的區域。
又,今後不管是室內或室外,在可使用近距離、中距離、或者長距離之複數種無線通訊的狀況下,利用MPEG-DASH等之發布系統規格,一邊對於連線中的通訊切換適合的資料一邊無縫地接收內容是可預想得到的。藉此,用戶除了本身的終端,也可一邊自由地選擇設在室內或室外之顯示器等解碼裝置或顯示裝置,一邊即時地進行切換。又,可根據本身的位置資訊等,一邊切換解碼的終端及顯示的終端一邊進行解碼。藉此,可在往目的地的移動中,一邊讓埋設有可進行顯示的元件之旁邊建築物的壁面或地面的一部分顯示地圖資訊一邊移動。又,也可基於在網路上對編碼資料的存取容易性,像是編碼資料被快取到可在短時間內從接收終端進行存取的伺服器、或者是被複製到內容傳遞服務(Contents Delivery Service)中的邊緣伺服器等,來切換接收資料的位元率。
[可適性編碼] 有關於內容的切換,是利用顯示於圖26之可適性串流來說明,其中前述串流是應用上述各實施形態所示的動態圖像編碼方法而被壓縮編碼的串流。伺服器具有內容相同但品質不同的複數個串流來作為個別串流雖無妨,但也可為靈活運用時間型/空間型可適性串流之特徵來切換內容的構成,其中前述時間型/空間型可適性串流是如圖所示藉由分層進行編碼而實現。即,解碼側因應所謂性能之內在因素及通訊頻帶的狀態等之外在因素,來決定要解碼到哪一層,藉此解碼側可自由地切換低解析度的內容及高解析度的內容並進行解碼。例如想要把曾在移動中於智慧型手機ex115收看的影像的後續部分在回家後以網路TV等的機器收看時,該機器只要將相同的串流解碼到不同層即可,因此可減輕伺服器側的負擔。
進而,如上述,除了在每層將圖片進行編碼、且在基本層的上位有加強層(enhancement layer)存在之實現可適性(scalability)的構成以外,也可是加強層包含有基於圖像的統計資訊等之詮釋資訊,且解碼側根據詮釋資訊將基本層的圖片進行超解析,藉此產生高畫質化的內容。所謂超解析也可是同一解析度下的SN比的提升、以及解析度的放大之任一者。詮釋資訊包含有用以特定超解析處理所使用的線性或非線性濾波係數之資訊、或用以特定超解析處理所使用的濾波處理、機械學習或最小平方運算中的參數值之資訊等。
或者,也可為如下構成,即,因應圖像內的目標等的意涵將圖片分割成圖塊等,解碼側藉由選擇要解碼的圖塊而只將一部分的區域解碼。又,把目標的屬性(人物、車、球等)與影像內的位置(同一圖像中的座標位置等)當作詮釋資訊來儲存,藉此,解碼側可根據詮釋資訊特定出希望的目標的位置,來決定包含前述目標的圖塊。例如,如圖27所示,詮釋資訊是使用HEVC中的SEI訊息等與像素資料不同之資料儲存構造來儲存。前述詮釋資訊是顯示例如主目標的位置、尺寸、或者色彩等。
又,也可以串流、序列或者隨機存取單位等由複數個圖片所構成的單位來儲存詮釋資訊。藉此,解碼側可取得特定人物出現在影像內的時刻等,藉由配合圖片單位的資訊,便可特定出目標存在的圖片、及目標在圖片內的位置。
[網頁的最適化] 圖28是顯示電腦ex111等中之網頁(web page)的顯示畫面例之圖。圖29是顯示智慧型手機ex115等中之網頁的顯示畫面例之圖。如圖28及圖29所示,網頁有包含複數個鏈接(link)圖像的情況,其中該等鏈接圖像為前往圖像內容的鏈接,且該等鏈接圖像的看到方式會依據閱覽的元件而有所不同。在畫面上看得到複數個鏈接圖像時,迄至用戶明確地選擇鏈接圖像為止,或者是迄至鏈接圖像靠近畫面的中央附近或鏈接圖像整體進入畫面內為止,顯示裝置(解碼裝置)都是顯示各內容所具有的靜止圖或I圖片來作為鏈接圖像,或以複數個靜止圖或I圖片等來顯示像gif動畫般的影像,或只接收基本層而解碼及顯示影像。
在由用戶選擇了鏈接圖像時,顯示裝置會將基本層視為最優先來進行解碼。另,若構成網頁的HTML中具有表示是可適性內容的資訊時,顯示裝置也可解碼至加強層為止。又,為了保證即時性,在被選擇之前或者通訊頻帶非常嚴苛時,顯示裝置只對參考前方的圖片(I圖片、P圖片、只參考前方的B圖片)進行解碼及顯示,藉此可減少前頭圖片的解碼時刻與顯示時刻間的延遲(從內容開始解碼至開始顯示為止的延遲)。又,顯示裝置也可硬是忽視圖片的參考關係而使全部的B圖片及P圖片參考前方,先粗略地進行解碼,經過一段時間,隨著接收的圖片增加,再進行正常的解碼。
[自動行駛] 又,為了汽車的自動行駛或者支援行駛,而發送及接收二維或三維的地圖資訊等靜止圖或影像資料時,接收終端除了屬於1層以上的層之圖像資料以外,也可接收天氣或者施工的資訊等來作為詮釋資訊,並使該等相對應而進行解碼。另,詮釋資訊可屬於層,也可單純地與圖像資料進行多工。
此時,包含有接收終端的車、空拍機或者飛機等會移動,因此接收終端會在請求接收時,發送該接收終端的位置資訊,藉此可一邊切換基地台ex106至ex110,一邊實現無縫的接收及解碼。又,接收終端可因應用戶的選擇、用戶的狀況或者通訊頻帶的狀態,而動態地切換將詮釋資訊接收到何種程度,或者是將地圖資訊更新到何種程度。
如以上,在內容供給系統ex100中,客戶端可即時接收用戶所發送的已編碼資訊,將其解碼且進行再生。
[個人內容的發布] 又,在內容供給系統ex100中,不只是來自影像發布業者的高畫質且長時間的內容,來自個人的低畫質且短時間的內容也可進行單播(unicast)或多播(multicast)發布。又,像這樣的個人內容,認為今後也會增加。為了將個人內容做成更優異的內容,伺服器也可進行編輯處理後再進行編碼處理。這例如可以如下的構成來實現。
伺服器即時地在攝影時或者累積到攝影後,從原圖或者編碼完畢資料中進行攝影錯誤、場景搜尋、意義的解析、及目標檢測等辨識處理。接著,伺服器根據辨識結果而手動或者自動地進行以下編輯:補正失焦或手震等、刪除明度比其他圖片低或未對焦的場景等重要性低的場景、強調目標的邊緣、或者是變化色調等。伺服器根據編輯結果,而將編輯後的資料進行編碼。又,已知道攝影時刻太長時收視率會下降,伺服器也可根據圖像處理結果,不只是對如上述般重要性低的場景,亦對動作少的場景等自動地進行剪輯,以因應攝影時間而成為特定時間範圍內的內容。或者,伺服器也可根據場景的意義解析的結果來產生摘要(digest),且進行編碼。
另,在個人內容中,有保持原狀會拍到侵害著作權、著作人格權、或者肖像權等的東西的事例,也有共享的範圍超過意圖的範圍等對個人來說不便的情況。因此,例如,伺服器也可刻意地將畫面周邊部的人臉或者是家裡等變更成不對焦的圖像再進行編碼。又,伺服器也可辨識在編碼對象圖像內是否有照到與事先登錄的人物不同之人物的臉,若有照到時,對臉的部分進行加上馬賽克等之處理。或者,作為編碼的前處理或者後處理,用戶也可從著作權等的觀點來對圖像指定想要加工的人物或者背景區域,且伺服器將指定的區域替換成別的影像或進行模糊焦點等的處理。若是人物時,可在動態圖像中一邊追蹤人物,一邊替換臉的部分的影像。
又,由於資料量小的個人內容的收看對即時性的要求高,所以雖也會取決於頻帶寬,但解碼裝置首先是最優先地接收基本層,且進行解碼及再生。解碼裝置也可在這期間接收加強層,且在循環再生等再生2次以上的情況下,連同加強層在內而再生高畫質的影像。若是這種進行可適性編碼的串流,就能提供如下體驗,即,在未選擇時或者剛開始看的階段是粗糙的動態圖,但串流漸漸地智能化(smart)而使圖像變好。除了可適性編碼以外,將第1次再生的粗糙串流、及參考第1次動態圖來編碼的第2次串流構成為1個串流,也可提供同樣的體驗。
[其他使用例] 又,該等編碼或者解碼處理,一般來說是在各終端所具有的LSIex500中處理。LSIex500可以是單晶片,也可以是由複數個晶片所構成。另,動態圖像編碼或解碼用的軟體也可安裝到可以電腦ex111等讀取的某些記錄媒體(CD-ROM、軟碟、或者硬碟等),並使用前述軟體來進行編碼或解碼處理。進而,智慧型手機ex115附有攝像機時,也可發送以前述攝像機取得的動態圖資料。此時的動態圖資料是已經利用智慧型手機ex115所具有的LSIex500編碼處理過的資料。
另,LSIex500也可為下載應用軟體來起動之構成。此時,首先,終端要判定該終端是否對應內容的編碼方式,或者是否具有特定服務的執行能力。在終端未對應內容的編碼方式時,或者不具有特定服務的執行能力時,終端要下載編解碼器(CODEC)或者應用軟體,之後進行內容的取得及再生。
又,不限於經由網際網路ex101的內容供給系統ex100,在數位播放用系統,也可安裝上述各實施形態之動態圖像編碼裝置(圖像編碼裝置)或動態圖像解碼裝置(圖像解碼裝置)的至少任一者。由於是利用衛星等而使播放用的電波承載影像與聲音已進行多工處理的多工資料來進行收發,所以相對於內容供給系統ex100之易於進行單播的構成,數位播放用系統的不同點雖在於適合多播,但有關於編碼處理及解碼處理,仍可做同樣的應用。
[硬體構成] 圖30是顯示智慧型手機ex115的圖。又,圖31是顯示智慧型手機ex115的構成例之圖。智慧型手機ex115包含有:天線ex450,用以與基地台ex110之間收發電波;攝像機部ex465,可拍攝影像及靜止圖;以及顯示部ex458,顯示已將以攝像機部ex465所拍攝的影像、及以天線ex450所接收的影像等進行解碼之資料。智慧型手機ex115更包含有:操作部ex466,為觸控面板等;聲音輸出部ex457,為用以輸出聲音或音響的揚聲器等;聲音輸入部ex456,為用以輸入聲音之麥克風等;記憶體部ex467,可將拍攝的影像或靜止圖、已錄音的聲音、已接收的影像或靜止圖、郵件等已編碼的資料或已解碼的資料加以保存;及插槽部ex464,為與SIMex468之間的介面部,其中SIMex468是用以特定出用戶,且對以網路為首的各種資料進行存取的認證。另,也可使用外接式記憶體來替代記憶體部ex467。
又,統合性地控制顯示部ex458及操作部ex466等的主控制部ex460,是經由匯流排ex470而與電源電路部ex461、操作輸入控制部ex462、影像訊號處理部ex455、攝像機I/F部ex463、LCD控制部ex459、調變/解調部ex452、多工/分離部ex453、聲音訊號處理部ex454、插槽部ex464、以及記憶體部ex467連接。
當藉由用戶的操作而使電源開關成為開啟狀態時,電源電路部ex461從電池組(battery pack)對各部供應電力,藉此使智慧型手機ex115起動成可動作的狀態。
智慧型手機ex115是基於具有CPU、ROM及RAM等之主控制部ex460的控制,而進行通話及資料通訊等的處理。在通話時,是將以聲音輸入部ex456所收音的聲音訊號,在聲音訊號處理部ex454轉換成數位聲音訊號,並將前述訊號在調變/解調部ex452進行展頻處理,在發送/接收部ex451實施數位類比轉換處理及頻率轉換處理,之後再經由天線ex450發送。又,將接收資料放大,並實施頻率轉換處理及類比數位轉換處理,在調變/解調部ex452進行解展頻處理,在聲音訊號處理部ex454轉換成類比聲音訊號,之後再將前述訊號從聲音輸出部ex457輸出。在資料通訊模式時,是透過本體部的操作部ex466等的操作,將正文(text)、靜止圖、或影像資料經由操作輸入控制部ex462而送出至主控制部ex460,且同樣地進行收發處理。在資料通訊模式時,於發送影像、靜止圖、或影像及聲音的情況下,影像訊號處理部ex455是將記憶體部ex467所保存的影像訊號或從攝像機部ex465所輸入的影像訊號,藉由上述各實施形態所示的動態圖像編碼方法而進行壓縮編碼,且將業經編碼的影像資料送出至多工/分離部ex453。又,聲音訊號處理部ex454是將在以攝像機部ex465拍攝影像或靜止圖等的同時以聲音輸入部ex456所收音的聲音訊號進行編碼,且將業經編碼的聲音資料送出至多工/分離部ex453。多工/分離部ex453將編碼完畢的影像資料及編碼完畢的聲音資料以規定的方式進行多工,且於調變/解調部(調變/解調電路部)ex452、及發送/接收部ex451實施調變處理及轉換處理,再經由天線ex450來發送。
在接收到電子郵件或對話(chat)所附的影像、或連結到網頁等的影像時,為了將經由天線ex450所接收到的多工資料進行解碼,多工/分離部ex453將多工資料進行分離,藉此把多工資料分成影像資料的位元串流及聲音資料的位元串流,經由同步匯流排ex470而將業經編碼的影像資料供給至影像訊號處理部ex455,並將業經編碼的聲音資料供給至聲音訊號處理部ex454。影像訊號處理部ex455藉由對應於上述各實施形態所示的動態圖像編碼方法之動態圖像解碼方法,而將影像訊號進行解碼,且經由顯示器控制部ex459而從顯示部ex458顯示被鏈接的動態圖像檔所包含的影像或者靜止圖。又,聲音訊號處理部ex454將聲音訊號進行解碼,且從聲音輸出部ex457輸出聲音。另,由於即時串流傳輸(real-time streaming)已經普及,依用戶的狀況,亦可能發生聲音的再生就社會觀點而言不妥的情況。為此,作為初始值,不要再生聲音訊號而只再生影像資料的構成是較被希望的。也可以是只有在用戶進行了操作,如點擊影像資料等的時候,才將聲音同步地再生。
又,在此是以智慧型手機ex115為例進行說明,但以終端而言,也可考慮如下3種組裝形式:除了具有編碼器及解碼器兩者的收發型終端之外,還有只具有編碼器的發送終端、及只具有解碼器的接收終端。進而,雖已說明在數位播放用系統中接收或發送在影像資料上已有聲音資料等被多工處理之多工資料的情形,但多工資料上除了聲音資料以外,也可有與影像有關聯的文字資料等被多工處理,且也可接收或發送影像資料本身而不是多工資料。
另,雖已說明包含有CPU的主控制部ex460控制編碼或解碼處理的情形,但終端具備GPU的情況也居多。因此,如後述構成也可,即,藉由在CPU與GPU共通化的記憶體、或以可共通使用的方式管理位址的記憶體,靈活運用GPU的性能而一次處理廣大的區域。藉此,可縮短編碼時間,確保即時性,可實現低延遲。尤其,不是利用CPU,而是利用GPU,以圖片等的單位一次進行移動估測、解區塊濾波、SAO(Sample Adaptive Offset)、及轉換/量化的處理時是有效率的。
產業上之可利用性 本揭示之編碼裝置及解碼裝置會達成有可能更加改良的效果,可利用在諸如電視、數位視訊錄影機、車用導航、行動電話、數位相機、數位視訊攝影機、車用照相機、以及網路照相機等資訊顯示機器或攝像機器,利用價值高。
10~19、20~23‧‧‧區塊
100、1a‧‧‧編碼裝置
102‧‧‧分割部
104‧‧‧減法部
106‧‧‧轉換部
108‧‧‧量化部
110‧‧‧熵編碼部
112、204‧‧‧反量化部
114、206‧‧‧反轉換部
116、208‧‧‧加法部
118、210‧‧‧區塊記憶體
120、212‧‧‧迴路濾波部
122、214‧‧‧幀記憶體
124、216‧‧‧幀內預測部
126、218‧‧‧幀間預測部
128、220‧‧‧預測控制部
160、260、2a、2b‧‧‧電路
162、262、3a、3b‧‧‧記憶體
200、1b‧‧‧解碼裝置
202‧‧‧熵解碼部
ex100‧‧‧內容供給系統
ex101‧‧‧網際網路
ex102‧‧‧網際網路服務提供者
ex103‧‧‧串流伺服器
ex104‧‧‧通訊網
ex106~ex110‧‧‧基地台
ex111‧‧‧電腦
ex112‧‧‧遊戲機
ex113‧‧‧攝像機
ex114‧‧‧家電
ex115‧‧‧智慧型手機
ex116‧‧‧衛星
ex117‧‧‧飛機
ex450‧‧‧天線
ex451‧‧‧發送/接收部
ex452‧‧‧調變/解調部
ex453‧‧‧多工/分離部
ex454‧‧‧聲音訊號處理部
ex455‧‧‧影像訊號處理部
ex456‧‧‧聲音輸入部
ex457‧‧‧聲音輸出部
ex458‧‧‧顯示部
ex459‧‧‧LCD控制部
ex460‧‧‧主控制部
ex461‧‧‧電源電路部
ex462‧‧‧操作輸入控制部
ex463‧‧‧攝像機I/F部
ex464‧‧‧插槽部
ex465‧‧‧攝像機部
ex466‧‧‧操作部
ex467‧‧‧記憶體部
ex468‧‧‧SIM
ex470‧‧‧匯流排
ex500‧‧‧LSI
S11a、S11b、S12a、S12b、S99、S100、S101、S102、S102a、S102b、S103、S201、S202‧‧‧步驟
圖1是顯示實施形態1之編碼裝置之功能構成的方塊圖。
圖2是顯示實施形態1之區塊分割之一例之圖。
圖3是顯示對應於各轉換類型之轉換基底函數之表。
圖4A是顯示在ALF所使用之濾波器的形狀一例之圖。
圖4B是顯示在ALF所使用之濾波器的形狀另一例之圖。
圖4C是顯示在ALF所使用之濾波器的形狀另一例之圖。
圖5A是顯示幀內預測中之67個幀內預測模式之圖。
圖5B是流程圖,用以說明OBMC處理之預測圖像補正處理之概要。
圖5C是概念圖,用以說明OBMC處理之預測圖像補正處理之概要。
圖5D是顯示FRUC一例之圖。
圖6是用以說明在沿著移動軌跡的2個區塊之間的樣式匹配(雙向匹配)之圖。
圖7是用以說明當前圖片內的模板與參考圖片內的區塊之間的樣式匹配(模板匹配)之圖。
圖8是用以說明假設等速直線運動之模型的圖。
圖9A是用以說明子區塊單位的移動向量之導出之圖,前述子區塊單位的移動向量是以複數個鄰接區塊之移動向量為基準。
圖9B是用以說明合併模式之移動向量導出處理之概要之圖。
圖9C是用以說明DMVR處理之概要之概念圖。
圖9D是用以說明預測圖像產生方法之概要之圖,前述預測圖像產生方法使用了LIC處理之亮度補正處理。
圖10是方塊圖,顯示實施形態1之解碼裝置的功能構成。
圖11是顯示實施型態2中的分割模式之一例的圖。
圖12是流程圖,顯示實施形態2中由編碼裝置的分割部而來的區塊分割資訊之語法決定處理之一例。
圖13是顯示實施形態2中的分割資訊之樹狀結構之一例的圖。
圖14是顯示實施形態2中的分割資訊之樹狀結構之一例的圖。
圖15是顯示實施形態2中的分割資訊之樹狀結構之另一例的圖。
圖16是顯示實施形態2中的分割資訊之樹狀結構之另一例的圖。
圖17是顯示實施形態2中的限制分割模式之出現順序的樹狀結構之一例的圖。
圖18是流程圖,顯示實施形態3中由編碼裝置的分割部而來的區塊分割資訊之語法決定處理之一例。
圖19是顯示實施形態3中的分割資訊之樹狀結構之一例的圖。
圖20是顯示實施形態3中的分割資訊之樹狀結構之一例的圖。
圖21是流程圖,顯示實施型態4中由編碼裝置的分割部而來的區塊分割資訊之語法決定處理之一例。
圖22是流程圖,顯示實施型態5中由編碼裝置的分割部而來的區塊分割資訊之語法決定處理之一例。
圖23是流程圖,顯示實施型態6中由解碼裝置的熵解碼部而來的區塊分割資訊之語法解碼處理之一例。
圖24A是方塊圖,顯示各實施型態中的編碼裝置之安裝例。
圖24B是流程圖,顯示各實施型態中的具備電路及記憶體的編碼裝置之處理動作。
圖24C是方塊圖,顯示各實施型態中的解碼裝置之安裝例。
圖24D是流程圖,顯示各實施型態中的具備電路及記憶體的解碼裝置之處理動作。
圖25是實現內容發布服務之內容供給系統的整體構成圖。
圖26是顯示可適性編碼時之編碼構造的一例之圖。
圖27是顯示可適性編碼時之編碼構造的一例之圖。
圖28是顯示網頁的顯示畫面例之圖。
圖29是顯示網頁的顯示畫面例之圖。
圖30是顯示智慧型手機的一例之圖。
圖31是顯示智慧型手機的構成例之方塊圖。

Claims (14)

  1. 一種編碼裝置,具備: 電路;以及 記憶體, 前述電路使用前述記憶體, 從複數個分割模式,選擇編碼對象區塊之分割模式, 並依照語法來產生表示針對前述編碼對象區塊而選擇的前述分割模式之分割資訊,其中前述語法是以將前述複數個分割模式作為複數個節點來包含的樹狀結構為基準; 在前述樹狀結構中, 當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是: (i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者 (ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。
  2. 如請求項1之編碼裝置,其中前述電路會藉由針對樹狀結構之各節點來選擇分割模式,而產生前述編碼對象區塊之分割資訊之產生所使用的前述樹狀結構, 且在前述樹狀結構之產生中,是以將選擇對象之節點作為根節點來包含的前述第1子樹內任意的節點之分割粒度大於前述第2子樹內任意的節點之分割粒度的方式,針對前述選擇對象之節點來選擇分割模式。
  3. 如請求項2之編碼裝置,其中前述電路在前述樹狀結構之產生中,是以分割粒度隨著前述樹狀結構之階層增加而單調增加或是單調減少的方式,針對各節點來選擇分割模式。
  4. 如請求項1至3中任一項之編碼裝置,其中前述電路進而從複數個樹狀結構中,根據規定的編碼參數來選擇任一個樹狀結構,藉此切換前述編碼對象區塊之分割資訊之產生所使用的前述樹狀結構。
  5. 如請求項4之編碼裝置,其中前述電路進而針對包含在前述複數個樹狀結構中全部的分割模式之個別模式,設定該分割模式之發生機率的初始值。
  6. 如請求項1之編碼裝置,其中前述複數個分割模式包含有將區塊3分割的分割模式。
  7. 一種解碼裝置,具備: 電路;以及 記憶體, 前述電路使用前述記憶體, 將複數個分割模式作為複數個節點來包含,且特定出在解碼對象區塊中有效的樹狀結構之屬性, 並依照以特定出的前述屬性之樹狀結構為基準的語法,來特定出針對前述解碼對象區塊而產生的分割資訊所表示的分割模式; 在前述樹狀結構中, 當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是: (i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者 (ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。
  8. 如請求項7之解碼裝置,其中前述樹狀結構是藉由針對樹狀結構之各節點來選擇分割模式而產生, 且在前述樹狀結構中,是以將選擇對象之節點作為根節點來包含的前述第1子樹內任意的節點之分割粒度大於前述第2子樹內任意的節點之分割粒度的方式,針對前述選擇對象之節點來選擇分割模式。
  9. 如請求項8之解碼裝置,其中在前述樹狀結構中,是以分割粒度隨著前述樹狀結構之階層增加而單調增加或是單調減少的方式,針對各節點來選擇分割模式。
  10. 如請求項7至9中任一項之解碼裝置,其中前述電路進而從複數個樹狀結構中,根據規定的編碼參數來選擇任一個樹狀結構,藉此切換前述解碼對象區塊之分割模式之特定所使用的前述樹狀結構。
  11. 如請求項10之解碼裝置,其中前述電路進而針對包含在前述複數個樹狀結構中全部的分割模式之個別模式,設定該分割模式之發生機率的初始值。
  12. 如請求項7之解碼裝置,其中前述複數個分割模式包含有將區塊3分割的分割模式。
  13. 一種編碼方法, 從複數個分割模式,選擇編碼對象區塊之分割模式, 並依照語法來產生表示針對前述編碼對象區塊而選擇的前述分割模式之分割資訊,其中前述語法是以將前述複數個分割模式作為複數個節點來包含的樹狀結構為基準; 在前述樹狀結構中, 當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是: (i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者 (ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。
  14. 一種解碼方法, 將複數個分割模式作為複數個節點來包含,且特定出在解碼對象區塊中有效的樹狀結構之屬性, 並依照以特定出的前述屬性之樹狀結構為基準的語法,來特定出針對前述解碼對象區塊而產生的分割資訊所表示的分割模式; 在前述樹狀結構中, 當相對各父節點具有第1子節點與第2子節點時,將前述第1子節點作為根節點來包含的第1子樹內全部的節點之個別節點的分割粒度是: (i) 將前述第2子節點作為根節點來包含的第2子樹內全部的節點之個別節點的分割粒度以上的大小;或者 (ii) 前述第2子樹內全部的節點之個別節點的分割粒度以下的大小。
TW107123150A 2017-07-06 2018-07-04 編碼裝置、解碼裝置、編碼方法及解碼方法 TW201907719A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US201762529353P 2017-07-06 2017-07-06
US62/529,353 2017-07-06

Publications (1)

Publication Number Publication Date
TW201907719A true TW201907719A (zh) 2019-02-16

Family

ID=64950073

Family Applications (1)

Application Number Title Priority Date Filing Date
TW107123150A TW201907719A (zh) 2017-07-06 2018-07-04 編碼裝置、解碼裝置、編碼方法及解碼方法

Country Status (2)

Country Link
TW (1) TW201907719A (zh)
WO (1) WO2019009314A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2953120T3 (es) 2019-04-23 2023-11-08 Guangdong Oppo Mobile Telecommunications Corp Ltd Método de decodificación de imágenes, decodificador y medio de almacenamiento
US20220353493A1 (en) * 2019-06-25 2022-11-03 Sony Group Corporation Information processing apparatus and method
CN110738735B (zh) * 2019-10-23 2023-11-07 黄河勘测规划设计研究院有限公司 一种提高三维数字地球平台展示效果的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8494290B2 (en) * 2011-05-05 2013-07-23 Mitsubishi Electric Research Laboratories, Inc. Method for coding pictures using hierarchical transform units
WO2016090568A1 (en) * 2014-12-10 2016-06-16 Mediatek Singapore Pte. Ltd. Binary tree block partitioning structure
US10284845B2 (en) * 2016-05-25 2019-05-07 Arris Enterprises Llc JVET quadtree plus binary tree (QTBT) structure with multiple asymmetrical partitioning

Also Published As

Publication number Publication date
WO2019009314A1 (ja) 2019-01-10

Similar Documents

Publication Publication Date Title
TWI729135B (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
TWI820019B (zh) 圖像解碼裝置及解碼方法
CN110495177B (zh) 解码装置、解码方法及存储介质
TWI830328B (zh) 編碼裝置、解碼裝置及電腦可讀取之非暫時性媒體
JPWO2018212110A1 (ja) 符号化装置、復号装置、符号化方法及び復号方法
TWI782974B (zh) 解碼裝置、解碼方法及非暫時性電腦可讀取媒體
CN113747173B (zh) 非暂时性存储介质
TWI826214B (zh) 編碼方法及解碼方法
TW202404351A (zh) 編碼裝置及解碼裝置
TWI825176B (zh) 編碼裝置、解碼裝置及電腦可讀取之非暫時性媒體
TWI812414B (zh) 編碼裝置、解碼裝置及記錄媒體
TW202322631A (zh) 編碼裝置、編碼方法、解碼裝置、解碼方法及電腦可讀取之非暫時性媒體
TW202002648A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
TWI814726B (zh) 編碼裝置及解碼裝置
TW201826796A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
TW201904293A (zh) 編碼裝置、編碼方法、解碼裝置及解碼方法
TW201907719A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
TW201911865A (zh) 編碼裝置、編碼方法、解碼裝置及解碼方法
TW201909631A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
CN117354539A (zh) 编码装置、解码装置、生成装置、发送装置和存储介质
TWI827605B (zh) 解碼裝置及解碼方法
WO2019138981A1 (ja) 符号化装置、復号装置、符号化方法および復号方法
TW201946468A (zh) 編碼裝置、解碼裝置、編碼方法及解碼方法
TW202415073A (zh) 編碼裝置、解碼裝置及電腦可讀取之非暫時性媒體