JP2017147750A - 画像復号装置、および画像符号化装置 - Google Patents

画像復号装置、および画像符号化装置 Download PDF

Info

Publication number
JP2017147750A
JP2017147750A JP2017084008A JP2017084008A JP2017147750A JP 2017147750 A JP2017147750 A JP 2017147750A JP 2017084008 A JP2017084008 A JP 2017084008A JP 2017084008 A JP2017084008 A JP 2017084008A JP 2017147750 A JP2017147750 A JP 2017147750A
Authority
JP
Japan
Prior art keywords
information
unit
flag
merge
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2017084008A
Other languages
English (en)
Other versions
JP6483183B2 (ja
Inventor
山本 智幸
Tomoyuki Yamamoto
智幸 山本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2017147750A publication Critical patent/JP2017147750A/ja
Application granted granted Critical
Publication of JP6483183B2 publication Critical patent/JP6483183B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • H04N19/463Embedding additional information in the video signal during the compression process by compressing encoding parameters before transmission
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/119Adaptive subdivision aspects, e.g. subdivision of a picture into rectangular or non-rectangular coding blocks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/46Embedding additional information in the video signal during the compression process
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】符号化データの符号化量をより削減する。【解決手段】動画像復号装置(1)は、符号化データに、量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報が含まれている場合、存否情報を復号しないTT情報復号部(14)と、符号化データに、存否情報をマージまたはスキップするマージ/スキップ情報が含まれている場合、該存否情報を推定するTT情報推定部(33)とを備え、TT情報復号部(14)は、TT情報推定部(33)が推定した存否情報を用いて符号化量子化変換係数を復号する。【選択図】図1

Description

本発明は、符号化データを復号する画像復号装置、および、符号化データを生成する画像符号化装置に関する。
動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置(画像符号化装置)、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置(画像復号装置)が用いられている。具体的な動画像符号化方式としては、例えば、H.264/MPEG−4.AVC(非特許文献1)、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、TMuC(Test Model under Consideration)ソフトウェアに採用されている方式、およびその後継コーデックであるWorking Draft 1 of High-Efficiency Video Coding(非特許文献2、以下、HEVC WD1とも呼ぶ)に採用されている方式などが挙げられる。
このような符号化方式において、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化単位(マクロブロックまたはコーディングユニット(CU:Coding Unit)と呼ばれることもある)、および、符号化単位を分割することより得られるブロックおよびパーティションからなる階層構造により管理され、普通、ブロックごとに符号化される。
また、このような符号化方式においては、通常、入力画像を符号化/復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像を入力画像(原画像)から減算して得られる予測残差(「差分画像」または「残差画像」と呼ぶこともある)が符号化される。また、予測画像の生成方法としては、画面間予測(インター予測)、および、画面内予測(イントラ予測)が挙げられる。
インター予測においては、復号済みのフレームを参照フレームとして、動きベクトルを用いた動き補償を適用することによって、復号中のフレーム内の予測画像が予測単位毎に生成される。
一方、イントラ予測においては、復号中のフレームの復号済領域に基づいて、復号中のフレーム内の予測画像が予測単位毎に生成される。H.264/MPEG−4.AVCに用いられているイントラ予測の一例としては、予測単位(例えば、パーティション)毎に、(1)予め定められた予測モード群から何れかの予測モードを選択し、(2)復号済領域の画素値を選択した予測モードに対応する外挿方向(予測方向)に外挿することによって、該予測単位上の画素値を生成する方法(「基本予測」とも呼ぶことがある)が挙げられる。
そして、非特許文献2には、復号に用いる情報の一部を省略(SKIP)、または推定(MERGE)することにより、符号化データの符号量を削減する技術が記載されている。より具体的には、CUを復号する際に用いる符号化データを構成する各種情報のうち、CUに含まれる変換ツリー(TT:transform tree)を示す情報、インター予測における予測単位(PU:prediction unit)の分割方法を示す情報をSKIPの対象としている。変換ツリーTTにはCU内の各部分領域に適用される変換単位(TU:transform unit)に関する情報が含まれる。また、インター予測における予測単位PUの分割方法を示す情報をMERGEの対象としている。
また、上記予測単位(PU:prediction unit)を復号する際に用いる符号化データを構成する各種情報のうち、インター予測のタイプを示す情報、インター予測を行う際の参照画像を示す情報、および動きベクトルを示す情報をSKIP、またはMERGEの対象としている。
また、非特許文献3には、MERGEの対象を、CUを復号する際に用いる符号化データに含まれる各種情報から、PUを復号する際に用いる符号化データに含まれる各種情報に変更した技術が開示されている。
「Recommendation ITU-T H.264」,Telecommunication Standardization Sector of ITU,03/2009 「JCTVC-C403」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,3rd Meeting: Guangzhou, CN, 7-15 October, 2010 「JCTVC-D441」,Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11,4th Meeting: Daegu, KR, 20-28 January, 2011
しかしながら、上記従来の構成では、符号化データに含まれる各種情報のうち、一部しかSKIPまたはMERGEの対象となっていない。また、SKIPまたはMERGEの対象となる各種情報が含まれる符号化データは、CUを復号する際に用いる符号化データか、PUを復号する際に用いる符号化データに限られている。
したがって、上記従来の構成では、符号化データの符号化量を十分に削減できていない。
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、符号化データの符号化量をより削減できる画像符号化装置等を実現することにある。
本発明の一態様に係る画像復号装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子化変換係数を含む符号化データを復号単位毎に復号することにより画像を復号する画像復号装置であって、上記変換単位は、符号化単位を階層的に分割することにより形成されるものであり、上記変換単位を分割して得られる部分単位は、上記変換単位とは異なり、該部分単位のサイズは、上記変換単位のサイズ以下であり、さらに、上記部分単位は、上記変換単位を正方形の格子状に分割して得られる4×4画素から成る単位であり、当該部分単位に非ゼロ変換係数が含まれているか否かを示す非ゼロ変換係数存否情報を推定、または、当該非ゼロ変換係数存否情報を上記符号化データから復号し、該非ゼロ変換係数存否情報が当該部分単位内に非ゼロ変換係数が存在することを示す場合、当該部分単位内の変換係数を上記符号化データから復号する復号手段を備え、上記復号手段は、上記部分単位が対応する変換単位において処理順で最後の部分単位である場合、当該部分単位について非ゼロ変換係数が存在すると推定することを特徴としている。
また、本発明の一態様に係る画像符号化装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子化変換係数を含む符号化データを出力する画像符号化装置であって、上記符号化データに、上記変換単位を分割して得られる部分単位について、当該部分単位に非ゼロ変換係数が含まれているか否かを示す非ゼロ変換係数存否情報をマージまたはスキップするマージ/スキップ情報を含める符号化手段を備えていることを特徴とする画像符号化装置。
本発明の一態様によれば、従来であれば、伝送することが必要であった周波数領域の変換係数の存在の有無を示す情報を伝送せずに済むので、符号化データの符号量を従来よりも削減することが可能となるという効果を奏する。
本発明の一実施の形態に係る動画像復号装置の要部構成を示すブロック図である。 動画像符号化装置によって生成され、上記動画像復号装置によって参照される符号化データのデータ構造を示すものであって、(a)は符号化データのピクチャレイヤの構成を示す図であり、(b)はピクチャレイヤに含まれるスライスレイヤの構成を示す図であり、(c)はスライスレイヤに含まれるTBLKレイヤの構成を示す図であり、(d)はTBLKレイヤに含まれるCUの構成を示す図であり、(e)はCUについてのインター予測情報の構成を示す図であり、(f)はCUについてのイントラ予測情報の構成を示す図であり、(g)はCUについての変換ツリーの構成を示す図である。 動画像符号化装置によって生成され、上記動画像復号装置によって参照される画像の構成を示す図であり、(a)はピクチャからスライスおよびTBLKが分割される状態を示す図であり、(b)、(c)はTBLKからCUが分割される状態を示す図である。 動画像符号化装置によって生成され、上記動画像復号装置によって参照される画像の構成を示す図であり、(a)はCUからイントラ予測単位が分割される状態を示す図であり、(b)はCUからインター予測単位が分割される状態を示す図であり、(c)はCUから変換単位が分割される状態を示す図である。 上記動画像復号装置のCU情報復号部の処理の内容を示すシンタックステーブルである。 上記CU情報復号部の処理内容を示すものであり、(a)、(b)はマージフラグ、マージレベルとマージ対象との関係を示す図である。 上記動画像復号装置のPT情報復号部の処理内容を示すシンタックステーブルである。 上記PT情報復号部の処理内容を示すものであり、(a)、(b)、(c)はマージフラグ、マージレベルとマージ対象との関係を示す図である。 上記動画像復号装置のTT情報復号部の処理の内容を示すシンタックステーブルである。 上記TT情報復号部の処理の内容を示すものであり、(a)は処理内容を示すシンタックステーブルであり、(b)はシンタックステーブルの内容を説明するための図である。 上記TT情報復号部の処理の内容を示すシンタックステーブルである。 上記TT情報復号部の処理内容を示すものであり、(a)、(b)はマージフラグ、マージレベルとマージ対象との関係を示す図である。 マージの例を説明するための図である。 マージの例を説明するための図である。 本実施の形態に係る動画像符号化装置の要部構成を示すブロック図である。 周波数領域の変換係数の存在有無CTCを表現するための説明図であり、(a)は非正方領域に分割してCTCを表現する場合を示す図であり、(b)はパラメータを用いてCTCを表現する場合を示す図であり、(c)はスキャン順を用いてCTCを表現する場合を示す図である。 動画像復号装置および動画像符号化装置が、動画像の送受信に利用できることを説明するための図であり、(a)は、動画像符号化装置を搭載した送信装置の構成を示したブロック図であり、(b)は、動画像復号装置を搭載した受信装置の構成を示したブロック図である。 動画像復号装置および動画像符号化装置が、動画像の記録および再生に利用できることを説明するための図であり、(a)は、動画像符号化装置を搭載した記録装置の構成を示したブロック図であり、(b)は、動画像復号装置を搭載した再生装置の構成を示したブロックである。
本発明に係る画像復号装置および画像符号化装置の実施形態について図面に基づいて説明すれば以下のとおりである。なお、本実施形態に係る画像復号装置は、符号化データから動画像を復号するものである。したがって、以下では、これを「動画像復号装置」と呼称する。また、本実施形態に係る画像符号化装置は、動画像を符号化することによって符号化データを生成するものである。したがって、以下では、これを「動画像符号化装置」と呼ぶ。
なお、本実施の形態では、各情報が、主にマージの対象となる場合について記載するが、スキップについても同様である。マージとは、復号に必要な所定の情報を省略し、既定または指定された位置にある情報に基づき推定されることをいう。また、スキップとは、復号に必要な所定の情報を省略し、推定値または既定値を代わりに用いることをいう。
(符号化データ#1の構成)
本実施の形態に係る動画像復号装置(画像復号装置)1の説明に先立ち、本実施の形態に係る動画像符号化装置2によって生成され、動画像復号装置1によって復号される符号化データ#1の構成について図2〜4を用いて説明する。符号化データ#1は、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
符号化データ#1におけるピクチャレイヤ以下の階層の構造を図2に示す。図2の(a)は、ピクチャPICTを規定するピクチャレイヤの構造を示す図である。図2の(b)は、スライスSを規定するスライスレイヤの構造を示す図である。図2の(c)は、ツリーブロック(Tree block)TBLKを規定するツリーブロックレイヤの構造を示す図である。図2の(d)は、ツリーブロックTBLKに含まれる符号化単位(CU:Coding Unit)を規定するCUレイヤの構造を示す図である。
また、図2の(e)は、予測ツリー(PT:prediction tree)についての情報であり、インター予測(画面間予測)パーティションについての予測情報PTIであるインター予測情報PTI_Interの構造を示す図である。図2の(f)は、予測ツリーPTについての情報であり、イントラ予測(画面内予測)パーティションについての予測情報PTIであるイントラ予測情報PTI_Intraの構造を示す図である。図2の(g)は、符号化単位CUに含まれる変換ツリー(TT:transform tree)についての情報である変換単位情報TTIの構造を示す図である。
また、図3、4は、ピクチャPICTからスライスS、ツリーブロックTBLK、予測単位PU、変換単位TUが分割される状態を示す図である。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図2の(a)に示すように、ピクチャヘッダPH、および、スライスS1〜SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスS1〜SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化データ#1に含まれるデータであって、添え字を付している他のデータについても同様である。
ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、動画像符号化装置2が符号化の際に用いた可変長符号化のモードを示す符号化モード情報(entropy_coding_mode_flag)は、ピクチャヘッダPHに含まれる符号化パラメータの一例である。
entropy_coding_mode_flagが0の場合、当該ピクチャPICTは、LCEC(Low Complexity Entropy Coding)、またはCAVLC(Context-based Adaptive Variable Length Coding)によって符号化されている。また、entropy_coding_mode_flagが1である場合、当該ピクチャPICTは、CABAC(Context-based Adaptive Binary Arithmetic Coding)によって符号化されている。
なお、ピクチャヘッダPHは、ピクチャー・パラメーター・セット(PPS:Picture Parameter Set)とも称される。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図2の(b)に示すように、スライスヘッダSH、および、ツリーブロックTBLK1〜TBLKNC(NCはスライスSに含まれるツリーブロックの総数)のシーケンスを含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単方向予測、または、イントラ予測を用いるPスライス、(3)符号化の際に単方向予測、双方向予測、または、イントラ予測を用いるBスライスなどが挙げられる。
また、スライスヘッダSHには、動画像復号装置1の備えるループフィルタ(不図示)によって参照されるフィルタパラメータが含まれていてもよい。
また、図3の(a)に示すように、スライスSは、ピクチャPICTが分割されることによって形成されている。図3の(a)では、ピクチャPICT301が分割されて、スライスS302が形成されている。
(ツリーブロックレイヤ)
ツリーブロックレイヤでは、処理対象のツリーブロックTBLK(以下、対象ツリーブロックとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
ツリーブロックTBLKは、ツリーブロックヘッダTBLKHと、符号化単位情報CU〜CUNL(NLはツリーブロックTBLKに含まれる符号化単位情報の総数)とを含む。ここで、まず、ツリーブロックTBLKと、符号化単位情報CUとの関係について説明すると次のとおりである。
ツリーブロックTBLKは、イントラ予測またはインター予測、および、変換の各処理のためのブロックサイズを特定するためのユニットに分割される。
ツリーブロックTBLKの上記ユニットは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するユニットを、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
つまり、符号化単位情報(以下、CU情報と称する)CU〜CUNLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、ツリーブロックTBLKに対応付けられる。換言すれば、ツリーブロックTBLKは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのユニット)のサイズの縦横とも半分である。
また、各符号化ノードのとり得るサイズは、符号化データ#1のシーケンスパラメータセットSPSに含まれる、符号化ノードのサイズ指定情報および最大階層深度(maximum hierarchical depth)に依存する。例えば、ツリーブロックTBLKのサイズが64×64画素であって、最大階層深度が3である場合には、当該ツリーブロックTBLK以下の階層における符号化ノードは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および8×8画素の何れかをとり得る。
また、ブロック構造としては、図3の(a)に示すように、スライスSが分割されて、ツリーブロックTBLK303が形成されている。そして、図3の(b)に示すように、ツリーブロックTBLK303が分割されてCU311が形成されている。
また、図3の(c)に、最大階層深度が「2」の場合に、ツリーブロックTBLK303が四分木分割される様子を示す。図3の(c)に示すように、最大階層深度が「2」で、後述するCU分割フラグ(split_coding_unit_flag)の値が階層0で「1」であり、かつ階層1でも「1」の場合、CU311bが符号化ノードとなる。なお、最大階層深度が「1」で、CU分割フラグの値が階層0で「1」の場合、CU311aが符号化ノードとなる。
(ツリーブロックヘッダ)
ツリーブロックヘッダTBLKHには、対象ツリーブロックの復号方法を決定するために動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図2の(c)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TBLK、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
ツリーブロック分割情報SP_TBLKは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。
なお、ツリーブロック分割情報SP_TBLKは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBLKは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグ(split_coding_unit_flag)の集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
ここで、CU情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリーPTおよび変換ツリーTTのルートとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(PU:prediction unit)とも称する。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(TU:transform unit)とも称する。
(CU情報CUのデータ構造)
続いて、図2の(d)を参照しながらCU情報CUに含まれるデータの具体的な内容について説明する。図2の(d)に示すように、CU情報CUは、スキップフラグSKIP、マージフラグMRG_CU、対象CUの各予測単位への分割パターンを指定するPU分割情報SP_PU、予測タイプ情報PType、PT情報PTI、および、TT情報TTIを含んでいる。
スキップフラグSKIPは、対象のCUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、スキップの対象となる各種情報は省略され、復号される際には、既定値または推定値が用いられる。なお、対象となる各種情報については、後述する。また、スキップフラグSKIPは、Iスライスでは省略される。
マージフラグMRG_CUは、対象のCUについて、マージモードが適用されているか否かを示すフラグであり、マージフラグMRG_CUの値が1の場合、すなわち、対象CUにマージモードが適用されている場合、マージの対象となる各種情報は省略され、復号される際には、推定値が用いられる。なお、対象となる各種情報については、後述する。
PU分割情報SP_PUは、対象CUに含まれる各PUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、PU分割情報SP_PUは、対象CUから、イントラ分割を指定するイントラ分割フラグ(intra_split_flag)、および、対象CUから、インター分割を指定するインター分割フラグ(inter_partitining_idc)の少なくとも何れか一方から実現することができる。
イントラ分割フラグは、対象CUに含まれる各イントラPU(イントラ予測が用いられるPU)の形状、サイズ、および、対象CU内での位置を指定する情報である。
インター分割フラグは、対象CUに含まれる各インターPU(インター予測が用いられるPU)の形状、サイズ、および、対象CU内での位置を指定する情報である。
予測タイプ情報PTypeは、対象PUについての予測画像生成方法として、イントラ予測を用いるのか、または、インター予測を用いるのかを指定する情報である。
PT情報PTIは、対象CUに含まれるPTに関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合であり、動画像復号装置1により予測画像を生成する際に参照される。PT情報PTIは、図2の(e)、(f)に示すように、予測タイプ情報PTypeが何れの予測方法を指定するのかに応じて、インター予測情報(PTI_Inter)、または、イントラ予測情報(PTI_Intra)より構成される。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。
TT情報TTIは、対象CUに含まれるTTに関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、動画像復号装置1により残差データを復号する際に参照される。
(インター予測情報PTI_Inter)
インター予測情報PTI_Interは、動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータが含まれる。図2の(e)に示すように、インター予測情報PTI_Interには、各PUについてのインター予測パラメータPP_Inter1〜PP_InterNe(Neは、対象CUに含まれるインター予測PUの総数)が含まれている。
インターPUは、対象CUを、2N×2N画素(対象CUと同一サイズ)、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)により分割することで作成される。
具体的に、図4の(b)を用いて説明する。図4の(b)に示すように、CU311から、2N×2N画素に分割されるとPU412aとなり、2N×N画素に分割されるとPU412bおよびPU412cとなり、N×2N画素に分割されるとPU412dおよびPU412eとなり、N×N画素に分割されるとPU412f〜PU412iとなる。
(インター予測パラメータ)
図2の(e)に示すように、インター予測パラメータPP_Interは、マージフラグMRG_PU、インター予測タイプIPT、参照画像インデックスRI、推定動きベクトルインデックスPMVI、動きベクトル残差MVDを含んでいる。
(イントラ予測情報PTI_Intra)
イントラ予測情報PTI_Intraは、動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータが含まれる。図2の(f)に示すように、イントラ予測情報PTI_Intraには、各PUについてのイントラ予測パラメータPP_Intra1〜PP_IntraNa(Naは、対象CUに含まれるイントラ予測PUの総数)が含まれている。
イントラPUは、イントラ分割フラグが1であれば、対象CUを4つのPUへと対称的に分割することにより生成され、イントラ分割フラグが0であれば、対象CUを分割することなく、対象CU自身がPUとして取り扱われる。したがって、対象CUのサイズを2N×2N画素とすると、イントラPUは、2N×2N画素(分割なし)、および、N×N画素(4分割)の何れかのサイズを取り得る(ここで、N=2n、nは1以上の任意の整数)。例えば、対象CUが、128×128画素であれば、128×128画素、および、64×64画素のイントラPUへ分割することが可能である。
具体的に、図4の(a)を用いて説明する。図4の(a)に示すように、CU311から、2N×2N画素に分割されるとPU411aとなり、N×N画素に分割されるとPU412b〜PU412eとなる。
(イントラ予測パラメータPP_Intra)
図2の(f)に示すように、イントラ予測パラメータPP_Intraは、マージフラグMRG_PU、イントラ予測モードIPMを含んでいる。
(TT情報TTI)
図2の(g)に示すように、TT情報TTIは、マージフラグMRG_TU、変換サイズTTS、変換タイプTTType、変換係数TTC、空間領域の変換係数の存在の有無CBP、周波数領域の変換係数の存在の有無CTC、量子化予測残差QDを、対象CUに含まれるTUの総数分含んでいる。
ここで、周波数領域の変換係数の存在の有無CTCとは、対象周波数領域(対象変換単位)に含まれる各変換係数が0であるか否かを示す情報や、対象周波数領域を分割して得られる各部分単位に非ゼロ変換係数が含まれるか否かを示す情報(非ゼロ変換係数存否情報)を含む概念である。
なお、対象周波数領域に含まれる各変換係数が0であるか否かを示す情報は、significant_coeff_flag[xC][yC](ここで、[xC][yC]は、対象周波数領域における各変換係数を位置を示す)と呼ばれることもあり、対象周波数領域を分割して得られる各部分単位に非ゼロ変換係数が含まれるか否かを示す情報は、significant_coeff_group_flag[xCG][yCG](ここで、[xCG][yCG]は、対象周波数領域における各部分単位の位置を示す)と呼ばれることもある。
TUは、対象CUを階層的に四分木分割することにより形成されており、対象CUまたは対象CUの部分領域の分割を行うのか否かを示す情報(split_transform_flag)により、サイズが決定する。split_transform_flagは基本的には四分木の各ノードに対して符号化されるが、変換サイズに関する制約(最大変換サイズ、最小変換サイズ、四分木の最大階層深度)に応じて省略されて推定される場合もある。
図4の(c)に、CU311が四分木分割されて、TUが形成される様子を示す。図4の(c)に示すように、階層0および階層1において、ノードの分割を行うことが示されている場合、PU413bがTUとなる。また、階層0でノードの分割を行い、階層1でノードの分割を行わないことが示されている場合、PU413aがTUとなる。
例えば、最大階層深度が「2」であり、対象CUのサイズが、64×64の場合、対象CUに含まれるTUは、64×64画素、32×32画素、または16×16画素のサイズをとり得る。
量子化予測残差QDは、動画像符号化装置2が以下の処理1〜3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差をDCT変換(Discrete Cosine Transform)する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(動画像復号装置1)
次に、図1、5〜12を参照して、動画像復号装置1の構成について説明する。図1は、動画像復号装置1の要部構成を示すブロック図である。図1に示すように、動画像復号装置1は、TBLK復号部(復号手段)10、フレームメモリ21を含む構成であり、TBLK復号部10には、TBLK情報復号部11、CU情報復号部12、PT情報復号部13、TT情報復号部(復号手段)14、およびCU画像生成部15が含まれている。また、CU情報復号部12にはCU情報推定部31が含まれ、PT情報復号部13にはPT情報推定部32が含まれ、TT情報復号部14にはTT情報推定部(推定手段)33が含まれている。
動画像復号装置1は、概略的に言えば、符号化データ#1を復号することによって復号画像#2を生成し、出力する装置である。また、動画像復号装置1は、その一部に、H.264/MPEG−4 AVC規格に採用されている技術、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている技術、TMuC(Test Model under Consideration)ソフトウェアに採用されている技術、およびその後継コーデックであるWorking Draft 1 of High-Efficiency Video Coding(HEVC WD1)に採用されている方式を用いている動画像復号装置である。
動画像復号装置1は、予測単位毎に予測画像を生成し、生成された予測画像と、符号化データ#1から復号された予測残差とを加算することによって復号画像#2を生成し、出力するものである。
動画像復号装置1に入力された符号化データ#1は、TBLK復号部10のTBLK情報復号部11へ入力される。
(TBLK情報復号部11)
TBLK情報復号部11は、入力された符号化データ#1から、ツリーブロックヘッダTBLKHに含まれるツリーブロック分割情報SP_TBLK、および量子化パラメータ差分Δqp(TBLKH情報)を復号する。
ツリーブロック分割情報には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報がふくまれている。そして、復号したTBLKH情報および符号化単位情報CUを含む分割情報#11をCU情報復号部12へ出力する。
(CU情報復号部12)
CU情報復号部12は、TBLK情報復号部11から入力された分割情報#11から、CU情報CUを復号して、CU復号情報#21、CU復号情報#22、CU復号情報#23を生成する。そして、CU復号情報#21をPT情報復号部13に、CU復号情報#22をTT情報復号部14に、CU復号情報#23をCU画像生成部15に入力する。
より具体的に説明すると、CU情報復号部12は、CU情報CUに含まれるスキップフラグSKIP(skip_flag)、およびマージフラグMRG_CU(cu_merge_flag)を復号する。そして、マージフラグMRG_CUの値が「1」の場合、さらに、CUマージ推定フラグ(cu_merge_left_flag)とCUマージレベルフラグ(cu_merge_level)とを復号する。
ここで、CUマージ推定フラグとは、値を推定するための参照先を示すフラグであり、CUマージレベルフラグとは、マージの対象となる情報を決定するためのフラグである。
そして、CU情報復号部12のCU情報推定部31は、スキップフラグSKIP、マージフラグMRG_CU、CUマージ推定フラグ、CUマージレベルフラグに基づいて、PU分割情報SP_PUの値、および予測タイプ情報PTypeの値を復号または推定する。
より詳細には、CU情報推定部31は、CUマージ推定フラグ(cu_merge_left_flag)の値に応じて参照対象となるCU(参照CU)を決定する。そして、参照CUが、イントラ予測CUである場合(すなわち、PredModeがMODE_INTRA)、参照CUのイントラ分割フラグ(intra_split_flag)の値を、対象CUのイントラ分割フラグの値と推定する。
また、参照CUがインター予測CUである場合(すなわち、PredModeがMODE_INTER)、参照CU内のPUであり、かつ、対象CUと隣接する参照CUとの境界の辺に隣接するPUの中でサイズが最小のPUに最も近いサイズとなるように、対象CUのイントラ分割の値を設定する。
そして、CU情報復号部12は、復号したスキップフラグSKIPの値、マージフラグMRG_CUの値(および、マージフラグMRG_CUの値が「1」の場合は、復号したCUマージ推定フラグ、CUマージレベルフラグの値)、復号または推定したPU分割情報SP_PUの値、同じく復号または推定した予測タイプ情報PTypeの値を含むCU復号情報#21をPT情報復号部13に出力する。
また、CU情報復号部12は、復号したスキップフラグSKIPの値、マージフラグMRG_CUの値(および、マージフラグMRG_CUの値が「1」の場合は、復号したCUマージ推定フラグ、CUマージレベルフラグの値)を含むCU復号情報#22をTT情報復号部14に出力する。
また、CU情報復号部12は、復号または推定したPU分割情報SP_PUの値、および予測タイプ情報PTypeの値を含むCU復号情報#23をCU画像生成部15に出力する。
次に、CU情報復号部12における処理について、図5、6を参照して説明する。図5は、CU情報復号部12における処理の内容を示すシンタックステーブルである。また、図6は、CU情報復号部12においてマージの対象を説明するための図であり、図6の(a)は、マージフラグおよびCUマージレベルフラグと復号対象との関係を示す図であり、図6の(b)は、マージフラグおよびCUマージレベルフラグとマージ対象との関係を示す図である。
図5に示すように、CU情報復号部12は、まず、符号化単位情報CUに含まれるスキップフラグSKIP(skip_flag)を復号する(st501)。そして、スキップフラグSKIPの値が「1」であれば(st502)、予測単位PUにおける処理に入る(st503)。
一方、スキップフラグSKIPの値が「1」でなければ、マージフラグMRG_CU(cu_merge_flag)を復号する(st504)。そして、マージフラグMRG_CUの値が「1」であれば、さらにCUマージ推定フラグ(cu_merge_left_flag)、CUマージレベルフラグ(cu_merge_level)を復号する(st505)。
次に、CU情報推定部31は、予測タイプ情報PType(pred_mode)を復号または推定する(st506)。そして、復号または推定した予測タイプ情報PTypeが、イントラ予測を示すものである場合、イントラ分割フラグ(intra_split_flag)を復号または推定する(st507)。
一方、復号または推定した予測タイプ情報PTypeが、インター予測を示すものである場合、インター分割フラグ(inter_partitining_idc)を復号または推定する(st508)。
そして、予測単位PUにおける処理(prediction_unit、st509)、変換単位TUにおける処理(transform_tree、st510)に入る。
次に、図6の(a)を参照して、復号および推定の対象となるフラグについて説明する。図6の(a)において、「○」は復号の対象となることを、「inf.」は推定値が用いられることを、「─」は不要であることをそれぞれ示している。
図6の(a)に示すように、マージフラグMRG_CUの値が「0」の場合は、CU単位で復号または推定の対象となる全てのフラグが復号される。また、マージフラグMRG_CUの値が「1」で、マージレベルフラグの値が「0」の場合は、pred_mode、prediction_unit、transform_treeの3つが復号され、intra_split_flag、inter_partitining_idcの2つが推定される。
また、マージフラグMRG_CUの値が「1」で、マージレベルフラグの値も「1」の場合は、prediction_unit、transform_treeの2つが復号され、pred_mode、intra_split_flag、inter_partitining_idcの3つが推定される。
また、マージフラグMRG_CUおよびCUマージレベルフラグとマージ対象との関係が、図6の(b)に示すようになっていてもよい。すなわち、マージフラグMRG_CUの値が「1」で、CUマージレベルフラグの値も「1」の場合は、予測単位(prediction_unit)および変換単位(transform_unit(tree))の2つがマージ対象となってもよい。また、マージフラグMRG_CUの値が「1」で、CUマージレベルフラグの値が「0」の場合は、予測単位(prediction_unit)のみがマージの対象となってもよい。
(PT情報復号部13)
PT情報復号部13は、CU情報復号部12から入力されたCU復号情報#21を復号して、PT復号情報#31を生成する。そして、生成したPT復号情報#31をCU画像生成部15に入力する。
より具体的に説明すると、PT情報復号部13は、PT情報PTIに含まれるマージフラグMRG_PU(pu_merge_flag)を復号する。そして、マージフラグMRG_PUの値が「1」であれば、PUマージ推定フラグ(pu_merge_left_flag)とPUマージレベルフラグ(pu_merge_level)を復号する。
ここで、PUマージ推定フラグとは、値を推定するための参照先を示すフラグであり、PUマージレベルフラグとは、マージの対象となる情報を決定するためのフラグである。
そして、PT情報復号部13のPT情報推定部32は、マージフラグMRG_CU、CUマージ推定フラグ、CUマージレベルフラグ、マージフラグMRG_PU、PUマージ推定フラグ、PUマージレベルフラグに基づいて、イントラ予測モードIPM(prev_intra_luma_pred_flag、rem_intra_luma_pred_mode)の値、インター予測タイプIPT(inter_pred_idc)の値、動きベクトル推定方法MVP(mvp_idx_lX)の値、動きベクトル残差MVD(mvd_lX)の値、参照画像RI(ref_idx_lX)の値、重み予測係数(weighted_pred_param)の値を復号または推定する。
より詳細には、PT情報推定部32は、PUマージ推定フラグ(pu_merge_left_flag)の値に応じて参照対象となるPU(参照PUを)決定する。そして、参照PUがイントラ予測CUに属する場合、参照PUのイントラ予測モード(intra_mode)の値を対象PUのイントラ予測モードの値と推定する。
また、参照PUがインター予測CUに属する場合、既定のイントラ予測モード(例えばDC予測モード)を示す値を、対象PUのイントラ予測モードの値に設定する。
ここで、イントラ予測モードは、符号化データの中では、イントラ予測モードと推定値との一致を示すフラグ(prev_intra_luma_pred_flag)と、イントラ予測モードの残差(rem_intra_luma_pred_mode)との組み合わせにより表現されている。上記のイントラ予測モードの推定では、イントラ予測モードが直接推定されてもよいし、prev_intra_luma_pred_flagとrem_intra_luma_pred_modeとを推定することにより間接的に推定されてもよい。
そして、PT情報復号部13は、動きベクトル推定方法MVPと動きベクトル残差MVDとに基づき動きベクトルMVを生成する。そして、PT情報復号部13は、イントラ予測モードIPM、インター予測タイプIPT、動きベクトルMV、参照画像RI、重み予測係数を含むPT復号情報#32をCU画像生成部15へ出力する。
次に、PT情報復号部13における処理について、図7、8を参照して説明する。図7は、PT情報復号部13における処理の内容を示すシンタックステーブルである。また、図8は、PT情報復号部13においてマージの対象を説明するための図であり、図8の(a)は、マージフラグおよびPUマージレベルフラグと復号対象との関係を示す図であり、図8の(b)、(c)は、マージフラグおよびPUマージレベルフラグとマージ対象との関係を示す図である。
図7に示すように、PT情報復号部13は、スキップフラグSKIPの値が「1」であると(st701)、動きベクトル推定方法MVP(mv_preditor())を復号する(st702)。なお、mv_preditor()は、mvp_idc_lXを上位概念化したものである。
一方、スキップフラグSKIPの値が「1」でなければ、PT情報復号部13は、マージフラグMRG_CUを確認し、マージフラグMRG_CUの値が「1」であれば、マージフラグMRG_PU、PUマージ推定フラグの値を、マージフラグMRG_CU、CUマージ推定フラグの値と同じとする。また、予測タイプ情報PTypeがインター予測であれば、PUマージレベルフラグの値をCUマージレベルフラグの値と同じとする(st703)。
また、マージフラグMRG_CUの値が「1」でなければ、マージフラグMRG_PU(pu_merge_flag)を復号する。そして、マージフラグMRG_PUの値が「1」であれば、PUマージ推定フラグ(pu_merge_left_flag)、PUマージレベルフラグ(pu_merge_level)を復号する(st704)。
次に、PT情報復号部13は、予測タイプ情報PTypeがイントラ予測であれば、イントラ予測モード(intra_mode)を復号または推定する(st705)。
また、予測タイプ情報PTypeがインター予測であれば、インター予測タイプIPT(inter_pred_idc)、動きベクトル推定方法MVP(mv_predictor())、重み予測係数(weighted_pred_param())を復号または推定する(st706)。
そして、PT情報復号部13は、動きベクトル残差MVD(mv_defference())、参照画像RI(ref_pictre())を復号または推定して(st707)、処理を終了する。
なお、mv_difference()はmvd_lXの、reg_picture()はref_idx_lXの上位概念である。
次に、図8の(a)を参照して、復号および推定の対象となるフラグについて説明する。図8の(a)において、「○」は復号の対象となることを、「inf.」は推定値が用いられることを、「def.」は既定値が用いられることを、「─」は不要であることをそれぞれ示している。
図8の(a)に示すように、マージフラグMRG_PUの値が「0」の場合は、PU単位で復号または推定の対象となる全てのフラグが復号される。
また、イントラ予測の場合、マージフラグMRG_PUの値が「1」のときは、merge_left_flagが復号され、prev_intra_luma_pred_flag、rem_intra_luma_pred_modeの2つが推定される。
また、インター予測の場合、マージフラグMRG_PUの値が「1」で、PUマージレベルフラグの値が「0」のときは、merge_left_flag、inter_pred_idc、mvd_idx_lXの3つが復号され、mvd_lXは既定値が与えられ、ref_idx_lX、weighted_pred_paramの2つが推定される。
また、マージフラグMRG_PUの値が「1」で、PUマージレベルフラグの値も「1」のときは、merge_left_flagが復号され、mvd_lXは既定値が与えられ、inter_pred_idc、mvd_idx_lX、ref_idx_lX、weighted_pred_paramの4つが推定される。
また、マージフラグMRG_PUおよびPUマージレベルフラグとマージ対象との関係が、図8の(b)に示すようになっていてもよい。すなわち、マージフラグMRG_PUの値が「1」で、PUマージレベルフラグの値も「1」の場合は、動き情報(動きベクトル推定方法(mvd_idx_lX)、動きベクトル残差(mvd_lX))、変換タイプ(transform_type)、変換係数(transform_coeff)の3つをマージ対象としてもよい。また、マージフラグMRG_PUの値が「1」で、PUマージレベルフラグの値が「0」の場合は、動き情報のみをマージの対象としてもよい。
なお、図8の(a)や図8の(b)に示したように、各マージレベルにおけるマージの対象を、異なるマージレベル間で包含関係とした場合、実装が容易になるという利点がある。しかしながら、そのような包含関係は必ずしも必須ではない。包含関係を用いないことにより、各レベルのマージ対象の組み合わせの自由度が向上し、符号量がより削減できる場合もある。
例えば、図8の(c)に示すように、マージレベルが「2」の場合に、「動き情報」と「変換係数」とがマージの対象となり、マージレベルが「1」の場合に、「動き情報」がマージの対象となり、マージレベルが「0」の場合に「変換係数」がマージの対象となるような構成であってもよい。
上記のような構成によれば、強いエッジの領域が存在するような場合に対応できる。強いエッジが存在する領域では、予測残差にもエッジが残る場合があり、その場合は変換係数をマージしない方が好ましいためである。また、平坦な領域において、実際の物体の動きとは異なる動きベクトルを用いる方が予想残差が小さくなる場合にも対応できる。このような場合は、変換係数はマージしても、動き情報はマージしない方が好ましいためである。
(TT情報復号部14)
TT情報復号部14は、CU情報復号部12から入力されたCU復号情報#22を復号して、TT復号情報#41を生成する。そして、生成したTT復号情報#41をCU画像生成部15へ入力する。
より具体的に説明すると、TT情報復号部14は、TT情報TTIに含まれるマージフラグMRG_TU(tu_merge_flag)を復号する。そして、マージフラグMRG_TUの値が「1」であれば、TUマージ推定フラグ(tu_merge_left_flag)とTUマージレベルフラグ(tu_merge_level)とを復号する。
ここで、TUマージ推定フラグとは、値を推定するための参照先を示すフラグであり、TUマージレベルフラグとは、マージの対象となる情報を決定するためのフラグである。
そして、TT情報復号部14のTT情報推定部33は、マージフラグMRG_CU、CUマージ推定フラグ、CUマージレベルフラグ、マージフラグMRG_TU、TUマージ推定フラグ、TUマージレベルフラグに基づいて変換サイズTTS(split_transform_flag)、空間領域の変換係数の存在有無CBP(cbp_luma/cb/cr, coded_block_flag_luma/cb/cr)、周波数領域の変換係数の存在有無CTC(coded_trans_coeff_pattern)を復号または推定する。
より詳細には、TT情報推定部33は、TUマージ推定フラグ(tu_merge_left_flag)の値に応じて参照方向を設定する。そして、参照方向に沿って隣接する2つのTUが同一の変換サイズを有するように、対象TTの変換サイズTTS(split_transform_flag)の値を設定する。
また、空間領域における変換係数の存在有無CBPについては、TT情報復号部14は、TUマージ推定フラグ(tu_merge_left_flag)の値に応じて参照方向を設定し、参照方向に沿って隣接する2つのTUにおいて変換係数の存在有無が一致するように、cbp_luma/cb/cr、およびcoded_block_flag_luma/cb/crの値を設定する。
なお、coded_block_flag_luma/cb/crは、分割が適用されないノード、すなわち各TUで符号化され、輝度または色差の変換係数のTU内への存在有無を示すフラグである。一方、cbp_luma/cb/crは、分割が適用される各ノード、すなわちTUを除くノードで符号化され、分割後の各領域への輝度または色差の変換係数の存在有無を示すフラグをまとめた情報である。coded_block_flag_luma/cb/crは、TU毎に推定した空間領域の変換係数の存在有無CBPより直接導出できる。cbp_luma/cb/crはTU毎に推定した空間領域の変換係数の存在有無CBPに基づき間接的に導出できる。
また、周波数領域における変換係数の存在有無CTCについては、TT情報復号部14は、まず、TUマージ推定フラグ(tu_merge_left_flag)の値に応じて参照TUを設定する。そして、参照TUと対象TUとのサイズが異なる場合、全ての周波数成分に対応する変換係数を復号することを示す情報を対象TUに設定する。
また、次のような処理を行ってもよい。周波数領域を既定の単位(例えば田の字型に4等分)に分割して、各単位毎に次の処理を適用する。(1)参照TUの周波数領域における当該単位内に変換係数が存在する場合は、対象TUの周波数領域における当該単位内にある変換係数を復号することを示す情報を対象TUに設定する。(2)これ以外の場合、対象TUの周波数領域における当該単位内にある変換係数を復号しないことを示す情報を対象TUに設定する。
なお、参照TUの周波数領域における当該単位内に変換係数が存在するか否かの判定は、CTCを参照して行うことができる。
また、より具体的には以下の処理を行ってもよい。
(1)対象周波数領域のサイズが16x16以上の場合、すなわち、
max( log2TrafoWidth, log2TrafoHeight ) > 3
である場合、当該対象周波数領域を分割して得られる部分単位CG(Coeff Group)毎に変換係数の存在有無を復号または推定する。
(2) 推定と復号は次の条件で選択する。
(a)対象部分単位に、DCが含まれる場合、または、(b)対象部分単位が対象周波数領域において処理順で最後の部分単位である場合、または、(c)対象部分単位の右側に隣接する部分単位及び対象部分単位の下側に隣接する部分単位の双方に非ゼロ変換係数が含まれている場合、すなわち、
(i = = numLastSubset) | | (rightCGFlag + bottomCGFlag = = 2) | | (i = = 0)
を満たしている場合には、CTCのうち、対象部分単位について非ゼロ変換係数が存在すると推定し、それ以外の場合には、CTCのうち、対象部分単位についての非ゼロ変換係数存否情報を復号する。
そして、TT情報復号部14は、変換サイズTTS、変換係数の存在有無の情報(TTC、CBP)に基づき復号または推定された変換係数を含むTT復号情報#41をCU画像生成部15へ出力する。
次に、TT情報復号部14における処理について、図9〜図12を参照して説明する。
図9〜11は、TT情報復号部14における処理の内容を示すシンタックステーブルである。また、図12は、TT情報復号部14においてマージまたはスキップの対象を説明するための図であり、図12の(a)は、マージフラグおよびPUマージレベルフラグと復号対象との関係を示す図であり、図12の(b)は、スキップフラグ(TU_skip_flag)およびスキップレベルフラグ(TU_skip_level)とスキップ対象との関係を示す図である。
図9に示すように、TT情報復号部14は、マージフラグMRG_CUの値が「1」の場合、マージフラグMRG_TUおよびTUマージ推定フラグの値を、マージフラグMRG_CUおよびCUマージ推定フラグの値とする。また、予測タイプ情報PTypeがインター予測であれば、TUマージレベルフラグの値をCUマージレベルフラグの値と同じとする(st901)。
また、マージフラグMRG_CUの値が「1」でなければ、マージフラグMRG_TU(tu_merge_flag)を復号する。そして、マージフラグMRG_TUの値が「1」であれば、TUマージ推定フラグ(tu_merge_left_flag)、TUマージレベルフラグ(tu_merge_level)を復号する(st902)。
次に、TT情報復号部14は、変換タイプTTType(transform_type)を復号し(st903)、符号化モード情報によって、CABACの場合(st904)と、LCECの場合(st905)とに分かれる。
図10の(a)に、符号化モード情報がCABACを示す場合のシンタックステーブルを示す。図10の(a)に示すように、TT情報復号部14は、イントラ予測の場合、空間領域毎の変換係数を備えるか否かを示す変換係数存否情報CV(no_resudual_data_flag)を復号する(st1001)。そして、変換サイズTTSを復号または推定し(st1002)、また、空間領域の変換係数の存在有無CBP、周波数領域の変換係数の存在有無CTCを復号または推定する(st1003)。
なお、周波数領域の変換係数の存在有無CTC(coded_trans_coeff_pattern)は、図10の(b)に示すようなブロックがあり、各ブロックの変換係数の存在有無がf0〜f3で表現されている場合に、coded_trans_coeff_pattern=f0+(f1<<1)+(f2<<2)+(f3<<3)となるものである。
図11に、符号化モード情報がLCECの場合のシンタックステーブルを示す。図11に示すように、符号化モード情報がLCECの場合、TT情報復号部14は、輝度、色差コンポーネント毎の変換係数を備えるか否かを示す変換係数存否情報LC(cbp_yuv_root)を復号する(st1101)。そして、空間領域の変換係数の存在有無CBPを復号または推定し(st1102)、周波数領域の変換係数の存在有無CTCを復号または推定する(st1103)。
次に、図12の(a)を参照して、復号および推定の対象となるフラグについて説明する。なお、図12の(a)において、「○」は復号の対象となることを、「inf.」は推定値が用いられることを、「def.」は既定値が用いられることを、「─」は不要であることをそれぞれ示している。
図12の(a)に示すように、マージフラグMRG_TUの値が「0」の場合は、split_transform_flag、transform_type、cbp_luma、coded_block_flag_luma、cbp_cb/cr、coded_block_flag_cb/cr、transform_coeffの7つが復号される。また、マージフラグMRG_TUの値が「1」で、TUマージレベルフラグの値が「0」のときは、split_transform_flag、tu_merge_left_flag、cbp_luma、 coded_block_flag_luma、transform_coeffの5つが復号され、transform_type、cbp_cb/cr、 coded_block_flag_cb/cr、の3つが推定される。
また、マージフラグMRG_TUの値が「1」で、TUマージレベルフラグの値も「1」のときは、split_transform_flag、tu_merge_left_flag、cbp_luma、 coded_block_flag_lumaの4つが復号され、transform_coeffの一部が復号され、transform_type、cbp_cb/cr、 coded_block_flag_cb/cr、coded_trans_coeff_patternの4つが推定される。
また、マージフラグMRG_TUの値が「1」で、TUマージレベルフラグの値が「2」のときは、tu_merge_left_flagの1つが復号され、split_transform_flag、transform_type、cbp_luma、 coded_block_flag_luma、cbp_cb/cr、 coded_block_flag_cb/crの6つが推定され、transform_coeffが既定値となる。
また、図12の(b)に示すように、スキップフラグ、スキップレベルとスキップの対象とを決定してもよい。すなわち、スキップフラグが「1」でスキップレベルが「2」の場合、スキップの対象は変換係数(全係数)とし、スキップフラグが「1」でスキップレベルが「1」の場合、スキップの対象は変換係数(非DC成分)とし、スキップフラグが「1」でスキップレベルが「0」の場合、スキップの対象は変換係数(高周波成分)としてもよい。
以上のように、本実施の形態では、周波数領域の変換係数の存在有無(coded_trans_coeff_pattern)をマージすることが可能である。周波数領域の変換係数は、空間相間があるので、上記の構成により、符号化データ#1の符号量を削減しつつ、質の高い復号画像#2を復号することが可能となる。
(CU画像生成部15)
CU画像生成部15は、CU情報復号部12から入力されたCU復号情報#23、PT情報復号部13から入力されたPT復号情報#31、TT情報復号部14から入力されたTT復号情報#41を用いて、CU画像を生成する。そして、生成したCU復号画像#51をTBLK画像生成部16へ出力する。
より詳細には、CU画像生成部15は、
PT復号情報#31に含まれるPU分割SP_PUと、予測タイプ情報PTypeが示す予測モードに基づき予測画像を生成する。具体的には、予測モードがイントラ予測の場合は、イントラ予測モードIPM、およびフレームメモリ21から入力された復号画像P´に基づき予測画像を生成し、予測モードがインター予測の場合は、インター予測タイプIPT、動きベクトルMV、参照画像RI、重み予測係数、および復号画像P´に基づき予測画像を生成する。
そして、TT復号情報#41に含まれる変換サイズTTS、変換係数に基づき予測残差を生成する。最後に、生成した予測画像と予測残差とを加算してCU復号画像#51を生成する。
(TBLK画像生成部16)
TBLK画像生成部16は、CU画像生成部15から入力されたCU復号画像#51を用いて復号画像#2を生成し、出力する。
(フレームメモリ21)
フレームメモリ21には、復号画像#2が記録される。フレームメモリ21には、対象TBLKを復号する時点において、当該対象TBLKよりも先に復号された全てのTBLK(例えば、ラスタスキャン順で先行する全てのTBLK)に対応する復号画像が記録されている。
(マージの例)
次に、図13、図14を参照して、マージされる例について説明する。図13はCU単位(CU情報CU、PT情報PTI)において、マージされる場合を説明するための図である。また、図14は、TU単位(TTI情報TTI)において、マージされる場合を説明するための図である。
図13には、CU1301、CU1302、CU1301´、CU1302´の4つのCUが示されている。そして、CU1301では、マージフラグMRG_CU(cu_merge_flag)が「0」で、PU分割情報SP_PU(intra_split_flag)が「0」、イントラ予測モードIPMが「DC予測」と仮定する。また、CU1302では、マージフラグMRG_CU(cu_merge_flag)が「0」で、PU分割情報SP_PU(intra_split_flag)が「1」、イントラ予測モードIPMが「水平予測」と仮定する。
CU1301では、PU分割情報SP_PU(intra_split_flag)が「0」なので、PUは、CUから分割されず同じ大きさとなっている。一方、CU1302では、PU分割情報SP_PU(intra_split_flag)が「1」なので、PUは、CUから四分木分割された状態となっている。
そして、CU1301´において、マージフラグMRG_CU(cu_merge_flag)が「1」、CUマージ推定フラグ(cu_merge_left_gflag)が「1」とすると、CU1301´では、PU分割情報SP_PU(intra_split_flag)の値を左方向に接しているCUから推定し「0」とする。また、イントラ予測モードIPMも左方向に接しているCUから推定し「DC予測」とする。よって、CU1301´では、CU1301と同様にPUが分割される。
また、CU1302´において、マージフラグMRG_CU(cu_merge_flag)が「1」、CUマージ推定フラグ(cu_merge_left_gflag)が「1」とすると、CU1301´では、PU分割情報SP_PU(intra_split_flag)の値を左方向に接しているCUから推定し「1」とする。また、イントラ予測モードIPMも左方向に接しているCUから推定し「水平予測」とする。よって、CU1302´では、CU1302と同様に、PUがCUから四分木分割される。
なお、マージの対象は、方向予測/DC予測を選択する情報(prev_intra_luma_pred_flag、rem_intra_luma_pred_flag)に限られず、エッジベース予測の適用有無を示す情報、planar予測の適用有無を示す情報、その他のイントラ予測方法の適用有無を示す情報、予測画像生成に用いるパラメータ等も可能である。ここで、エッジベース予測とは、隣接領域の復号画像の画素値やイントラ予測モードに基づき推定されたエッジ方向を利用する予測であり、planar予測とは、PU内の右下画素値の推定値とPU隣接領域の復号画像の画素値に基づく内挿を利用する予測である。
また、PU分割情報SP_PUに限られず、ツリーブロック分割情報SP_TBLK(split_coding_unit_flag)もマージの対象となりうる。
次に、TU単位でマージする場合について説明する。図14には、CU1401、CU1401´の2つのCUが示されている。そして、CU1401では、マージフラグMRG_TU(tu_merge_flag)が「0」、変換サイズTTSが「有」、空間領域の変換係数の存在有無CBPが「有」、変換係数TTCが「全周波数成分」となっていると仮定する。
そして、CU1401´において、マージフラグMRG_TU(tu_merge_flag)の値が「1」、TUマージ推定フラグ(tu_merge_left_flag)の値が「1」の場合、CU1401のTT情報TTIについては、左方向に接しているCUから値を推定する。よって、CU1401´では、変換サイズTTS、空間領域の変換係数の存在有無CBPを、CU1401からコピーして同じ値となる。
また、変換係数TTCについては、すべてをコピーしてもよいし、一部のみコピーしてもよい。たとえば、CU1401に属するPU1411において、画素1420a〜dにのみ非ゼロの変換係数が存在しているような場合、当該変換係数をコピーするCU1401´に属するPU1411´では、非ゼロ変換係数を含む領域1421のみ、変換係数をコピーしてもよい。
なお、マージの対象は、変換サイズTTS(split_transform_flag)、空間領域毎の変換係数の存在有無(no_residual_data_flag, cbp_luma/cb/cr, coded_block_flag_luma/cb/cr)だけでなく、輝度/色差コンポーネント毎の変換係数の存在有無(cbp_yuv_root)、特定周波数成分の変換係数存在有無もなりうる。
以上のように、本実施の形態では、イントラ予測の関する情報(予測モードPType(pred_mode)、イントラ予測モードIPT(prev_intra_luma_pred_flag、rem_intra_luma_pred_mode))をマージすることが可能である。イントラ予測に関する情報は、空間相間があるので、上記の構成により、符号化データ#1の符号量を削減しつつ、質の高い復号画像#2を復号することが可能となる。
また、本実施の形態では、重み予測係数(weighted_prede_param)をマージすることが可能である。重み予測係数は、空間相間があるので、上記の構成により、符号化データ#1の符号量を削減しつつ、質の高い復号画像#2を復号することが可能となる。
また、本実施の形態では、変換サイズTTS(split_transform_type)、変換タイプTTType(transform_type)といった変換情報をマージすることが可能である。変換情報は、空間相間があるので、上記の構成により、符号化データ#1の符号量を削減しつつ、質の高い復号画像#2を復号することが可能となる。
また、本実施の形態では、空間領域の変換係数の存在の有無(no_residual_data_flag、cbp_luma/cb/cr、coded_block_flag_luma/cb/cr)をマージすることが可能である。空間領域の変換係数は、空間相間があるので、上記の構成により、符号化データ#1の符号量を削減しつつ、質の高い復号画像#2を復号することが可能となる。
(動画像符号化装置2)
次に、図15を参照して、動画像符号化装置(画像復号装置)2について説明する。なお、既に説明した部分については、同じ符号を付し、その説明を省略する。動画像符号化装置2は、概略的に言えば、入力画像#100を符号化することによって符号化データ#1を生成し、出力する装置である。また、動画像符号化装置2は、その一部に、H.264/MPEG−4 AVC規格に採用されている技術、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている技術、TMuC(Test Model under Consideration)ソフトウェアに採用されている技術、および、その後継コーデックであるHEVC WD1に採用されている方式を用いている動画像符号化装置である。
図15は、動画像符号化装置2の要部構成を示すブロック図である。図15に示すように、動画像符号化装置2は、TBLK設定部51、TBLK符号化部(符号化手段)52、TBLK復号部10、フレームメモリ54を含む構成である。
TBLK設定部51は、入力画像#100に基づいて、TBLKの構成を設定する。具体的には、対象スライスに属するTBLKのサイズ、形状および対象スライス内での位置、各TBLKに属するCUのサイズ、形状および対象TBLK内での位置等を設定する。そして、設定した情報である設定情報#61をTBLK符号化部52へ出力する。
TBLK符号化部52は、TBLK設定部51から入力された設定情報#61に基づいて、入力画像#100の符号化を行う。より詳細には、TBLK符号化部52は、設定情報#61に基づいて、ツリーブロックTBLKごとに、符号化単位CU、予測単位PU、変換単位TUに分割する。そして、フレームメモリ54に格納されている復号画像#63を用いて予測単位PUごとに予測画像を生成し、元画像と予測画像との差分である予測残差を変換単位TUごとに変換した変換係数、および変換係数以外のサイド情報を符号化した符号化データ#1を生成して、出力する。
TBLK復号部10は、動画像復号装置1のTBLK復号部10と同様であるので、ここでは説明を省略する。
フレームメモリ54は、入力された復号画像#62が記録される。対象TBLKを符号化する時点では、当該対象TBLKよりもラスタスキャン順で先行する全てのTBLKに対応する復号画像がフレームメモリ54に記録されている。
(付記事項1)
なお、上述した実施の形態では、マージの際に参照するCUを、対象CUの左辺に接しているCUとしたが、これに限られるものではない。例えば、対象CUの上辺に接してるCUであってもよいし、対象CUとは接していないが、近傍に存在するCUであってもよい。また、前フレームに属するCUであってもよい。
(付記事項2)
また、上述した実施の形態では、マージフラグとマージレベルフラグとが同じ情報単位で伝送される場合について記載したが、これに限られるものではない。例えば、マージフラグMRG_PU(pu_merge_flag)をCU情報CU内で伝送し、PUマージレベルフラグ(pu_merge_level_flag)をPT情報PTI内で伝送してもよい。また、PUマージレベルフラグ(pu_merge_level_flag)をスライスS内で伝送し、マージフラグMRG_PU(pu_merge_flag)をPT情報PTI内で伝送してもよい。
これにより、階層を変えて符号化することができるので、予測残差を除く情報であるサイド情報を削減することができる。
(付記事項3)
また、復号履歴を活用してマージを行う構成であってもよい。すなわち、復号履歴を活用する適応マージモードを設け、復号しながら隣接領域のフラグ(syntax)間の関連性を計測する。そして、関連性が閾値を超えるフラグをマージの対象としてもよい。
具体的には、まず、適応マージモードによるPU単位のマージ対象となり得るフラグ(syntax)としてsyntax1〜syntaxMを定義する。
そして、syntaxk(1≦k≦M)について、relV(k)を0に設定する。relV(k)は、上下隣接ブロック間のsyntaxの関連性を強さ示すものである。また、relH(k)を0に設定する。relH(k)は、左右隣接ブロック間のsyntaxの関連性の強さ示すものである。また、cnt(k)を0に設定する。
そして、PT情報PTI復号時に適応マージモードが選択されている場合、以下の条件を満たすフラグをマージにより推定する。
merge_k_flag = (relV(k) / cnt(k) > Th(k) || relH(k) / cnt(k) > Th(k)) ? 1 : 0
マージの際に、参照するPUの位置はrelV(k)>relH(k)ならば上側、それ以外なら左側とする(マージ対象の位置を示す情報は復号しない)。また、条件を満たさない場合は対応するフラグを復号する。
最後に、PU復号、k(1≦k≦M)について、以下の処理を実行する。
(1)syntaxkが対象PUと上側隣接PUで一致する場合: relV(k)+=1
(2)syntaxkが対象PUと左側隣接PUで一致する場合: relH(k)+=1
(3)cnt(k)+=1
(付記事項4)
また、マージする対象をヘッダで送ってもよい。これは、例えば、対象を明示的に伝送してもよいし、既定の組み合わせから選択するものであってもよいし、特定のレベルに対する対象のみ伝送するものであってもよい。
(付記事項5)
マージレベルについては、対象CU、PU、TUのサイズが既定のサイズよりも大きい場合に伝送するものであってもよい。
(付記事項6)
また、上述した実施形態では、周波数領域の変換係数の存在有無(以下ではCTCと記載)について図10の(b)に示すような周波数領域を分割した各部分周波数領域への変換係数存在有無を示すフラグの集合としているが、以下の表現も可能である。図16を参照して説明する。図16は、周波数領域の変換係数の存在有無CTCを表現するための説明図であり、図16の(a)は非正方領域に分割してCTCを表現する場合を示す図であり、図16の(b)はパラメータを用いてCTCを表現する場合を示す図であり、図16の(c)はスキャン順を用いてCTCを表現する場合を示す図である。
(A)非正方形領域への周波数領域の分割による表現
周波数領域を非正方形の部分周波数領域に分割して領域毎に変換係数の存在有無を示すフラグを設定し、当該フラグを集めた情報をCTCとしてもよい。例えば、図16の(a)に示すように、DC部、水平エッジ部(水平周波数成分が大きく、垂直周波数成分が小さい領域)、垂直エッジ部(垂直周波数成分が大きく、水平周波数成分が小さい領域)、高周波成分(垂直・水平周波数成分がともに大きい領域)に、周波数領域を分割し、それぞれの領域における変換係数の存在有無を、フラグfDC、f、f、fHFに対応付け、これをCTCとする。このようなCTCの表現を適用した場合、マージ処理における推定は、参照されるTUにおける対応する部分周波数領域における変換係数有無を示すフラグをコピーすることで実現できる。また、分割される周波数領域を正方形に制限しないことにより、より柔軟に変換係数の存在有無のフラグを設定することが可能となる。
(B)パラメータ表現
周波数領域内で変換係数が存在し得る領域を、周波数に係るパラメータにより表現することもできる。図16の(b)に示すように、パラメータkを定義し、水平周波数成分が0以上k以下であり、かつ、垂直周波数成分が0以上k以下である部分周波数領域内に変換係数を含むようなkの値をCTCに設定する。例えば、ブロックサイズが8×8画素である場合、k=0はDC成分にのみ変換係数が存在し得ることを意味し、k=7の場合は全ての周波数成分に変換係数が存在し得ることを意味する。このようなCTCの表現を適用した場合、マージ処理における対象TUにおけるCTCの値kの推定は、参照TUにおけるCTCの値をk´、対象TUに対する参照TUのサイズの比をrとした場合、k=Int(k´÷r)により導出できる。ここで、Int()は引数の整数部分を取りだす関数である。パラメータによる表現により、単純に周波数領域を分割する場合と較べてより細かい精度で変換係数の存在有無を表現することが可能となる。
(C)スキャン順を利用した表現
周波数領域内で変換係数が存在し得る領域を、変換係数のスキャン順で最後に変換係数が発生する位置(last_coeff)の取り得る範囲により表現することができる。last_coeffは図16の(c)のように、周波数領域において、矢印で示す順に変換係数がスキャンされたときに、最後に変換係数が発生した位置と定義される。TUのサイズが8×8画素である場合は0〜63の値を取る。変換係数は、スキャン順で0〜last_coeffの位置にのみ存在する可能性があるため、last_coeffの範囲を決めることで、変換係数の存在し得る領域を定めることができる。マージ処理における対象TUにおけるlast_coeffの取り得る範囲は、参照TUにおけるlast_coeffの値をm´とすると、0〜min(m´+α,b−1)と推定できる。ここで、αはlast_coeffの位置の変化を示す値であり、例えばTUの幅を設定する。また、bはTUに含まれる画素数である。この方法によれば、スキャン順を変更することなく周波数領域内での変換係数の存在有無を考慮した変換係数の符号化が行えるため、実装が容易となる。
本発明は上述した実施の形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。すなわち、請求項に示した範囲で適宜変更した技術的手段を組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
(応用例)
上述した動画像復号装置1および動画像符号化装置2は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
まず、上述した動画像復号装置1および動画像符号化装置2を、動画像の送信及び受信に利用できることを、図17を参照して説明する。
図17(a)は、動画像符号化装置2を搭載した送信装置Aの構成を示したブロック図である。図17(a)に示すように、送信装置Aは、動画像を符号化することによって符号化データを得る符号化部A1と、符号化部A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部A2と、変調部A2が得た変調信号を送信する送信部A3と、を備えている。上述した動画像符号化装置2は、この符号化部A1として利用される。
送信装置Aは、符号化部A1に入力する動画像の供給源として、動画像を撮像するカメラA4、動画像を記録した記録媒体A5、動画像を外部から入力するための入力端子A6、および画像を生成または加工する画像処理部A7を更に備えていてもよい。図17(a)においては、これら全てを送信装置Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体A5と符号化部A1との間に、記録媒体A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図17(b)は、動画像復号装置1を搭載した受信装置Bの構成を示したブロック図である。図17(b)に示すように、受信装置Bは、変調信号を受信する受信部B1と、受信部B1が受信した変調信号を復調することによって符号化データを得る復調部B2と、復調部B2が得た符号化データを復号することによって動画像を得る復号部B3と、を備えている。上述した動画像復号装置1は、この復号部B3として利用される。
受信装置Bは、復号部B3が出力する動画像の供給先として、動画像を表示するディスプレイB4、動画像を記録するための記録媒体B5、及び、動画像を外部に出力するための出力端子B6を更に備えていてもよい。図17(b)においては、これら全てを受信装置Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部B3と記録媒体B5との間に、復号部B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置A/受信装置Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置A/受信装置Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置A/受信装置Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置A及び受信装置Bの双方として機能する。
次に、上述した動画像復号装置1および動画像符号化装置2を、動画像の記録及び再生に利用できることを、図18を参照して説明する。
図18(a)は、上述した動画像復号装置1を搭載した記録装置Cの構成を示したブロック図である。図18(a)に示すように、記録装置Cは、動画像を符号化することによって符号化データを得る符号化部C1と、符号化部C1が得た符号化データを記録媒体Mに書き込む書込部C2と、を備えている。上述した動画像符号化装置2は、この符号化部C1として利用される。
なお、記録媒体Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録装置Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置Cは、符号化部C1に入力する動画像の供給源として、動画像を撮像するカメラC3、動画像を外部から入力するための入力端子C4、動画像を受信するための受信部C5、および、画像を生成または加工する画像処理部C6を更に備えていてもよい。図18(a)においては、これら全てを記録装置Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部C5と符号化部C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置Cとしては、例えば、DVDレコーダ、BDレコーダ、HD(Hard Disk)レコーダなどが挙げられる(この場合、入力端子C4又は受信部C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラC3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部C5または画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラC3又は受信部C5が動画像の主な供給源となる)なども、このような記録装置Cの一例である。
図18(b)は、上述した動画像復号装置1を搭載した再生装置Dの構成を示したブロックである。図18(b)に示すように、再生装置Dは、記録媒体Mに書き込まれた符号化データを読み出す読出部D1と、読出部D1が読み出した符号化データを復号することによって動画像を得る復号部D2と、を備えている。上述した動画像復号装置1は、この復号部D2として利用される。
なお、記録媒体Mは、(1)HDDやSSDなどのように、再生装置Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置Dは、復号部D2が出力する動画像の供給先として、動画像を表示するディスプレイD3、動画像を外部に出力するための出力端子D4、及び、動画像を送信する送信部D5を更に備えていてもよい。図18(b)においては、これら全てを再生装置Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部D2と送信部D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイD3が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子D4又は送信部D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイD3又は送信部D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイD3又は送信部D5が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイD3又は送信部D5が動画像の主な供給先となる)なども、このような再生装置Dの一例である。
(ソフトウェアによる構成)
最後に、動画像復号装置1および動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現していてもよいし、CPU(central processing unit)を用いてソフトウェア的に実現してもよい。
後者の場合、動画像復号装置1および動画像符号化装置2は、各機能を実現する制御プログラムの命令を実行するCPU、上記プログラムを格納したROM(read only memory)、上記プログラムを展開するRAM(random access memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである動画像復号装置1および動画像符号化装置2の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記の動画像復号装置1および動画像符号化装置2に供給し、そのコンピュータ(またはCPUやMPU(microprocessor unit))が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM(compact disc read-only memory)/MO(magneto-optical)/MD(Mini Disc)/DVD(digital versatile disk)/CD−R(CD Recordable)等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM(erasable programmable read-only memory)/EEPROM(electrically erasable and programmable read-only memory)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、動画像復号装置1および動画像符号化装置2を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN(local area network)、ISDN(integrated services digital network)、VAN(value-added network)、CATV(community antenna television)通信網、仮想専用網(virtual private network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE(institute of electrical and electronic engineers)1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(asynchronous digital subscriber loop)回線等の有線でも、IrDA(infrared data association)やリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(high data rate)、NFC(Near Field Communication)、DLNA(登録商標)(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。なお、本発明は、上記プログラムコードが電子的な伝送で具現化された、搬送波に埋め込まれたコンピュータデータ信号の形態でも実現され得る。
(付記事項7)
本発明は以下のように記載することもできる。
本発明に係る画像復号装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データを復号することにより画像を復号する画像復号装置であって、上記符号化データに、上記量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報が含まれている場合、上記存否情報を復号しない復号手段と、上記符号化データに、上記存否情報をマージまたはスキップするマージ/スキップ情報が含まれている場合、該存否情報を推定する推定手段とを備え、上記復号手段は、上記推定手段が推定した存否情報を用いて上記符号化量子化変換係数を復号する。
ここで、マージとは、復号に必要な所定の情報を省略し、既定または指定された位置にある情報に基づき推定されることをいう。また、スキップとは、復号に必要な所定の情報を省略し、推定値または既定値を代わりに用いることをいう。
上記の構成によれば、周波数領域の変換係数の存在の有無を示す情報を伝送せずに、マージ/スキップ情報のみを伝送することで復号を行うことができる。
よって、従来であれば、伝送することが必要であった周波数領域の変換係数の存在の有無を示す情報を伝送せずに済むので、符号化データの符号量を従来よりも削減することが可能となる。
本発明に係る画像復号装置では、上記存否情報とは、上記量子化変換係数における周波数成分の直流成分を除く成分に非ゼロ変換係数が含まれているか否かを示す情報であってもよい。
上記の構成によれば、量子化変換係数における周波数成分の直流成分を除く成分に非ゼロ変換係数が含まれているか否かを示す情報を伝送せずに、マージ/スキップ情報のみを伝送することで復号を行うことができる。
直流成分を除く成分に非ゼロ変換係数が含まれているか否かは、非常に高い空間相関をもっており、的確に推定できる可能性が高い。よって、符号化データの符号量を削減しつつ、質の高い復号画像を生成することができる。
本発明に係る画像復号装置では、上記存否情報とは、上記量子化変換係数における周波数成分の高周波成分に非ゼロ変換係数が含まれているか否かを示す情報であってもよい。
上記の構成によれば、量子化変換係数における周波数成分の高周波成分に非ゼロ変換係数が含まれているか否かを示す情報を伝送せずに、マージ/スキップ情報のみを伝送することで復号を行うことができる。
周波数成分の高周波成分に非ゼロ変換係数が含まれているか否かは、非常に高い空間相関をもっており、的確に推定できる可能性が高い。よって、符号化データの符号量を削減しつつ、質の高い復号画像を生成することができる。
本発明に係る画像復号装置では、上記符号化データには、マージまたはスキップの対象となる情報を選択するためのマージ/スキップレベル情報が含まれていてもよい。
上記の構成によれば、マージ/スキップレベルに応じて、マージまたはスキップの対象となる情報を決定することができる。よって、情報ごとにマージまたはスキップをするか否かを決定することができるので、局所的特性に合わせてマージまたはスキップの対象を決定することができる。
本発明に係る画像復号装置では、上記マージ/スキップレベル情報は、レベルに応じて、マージまたはスキップの対象となる情報が包含関係となっていてもよい。
上記の構成によれば、レベルに応じて、マージまたはスキップの対象となる情報が包含関係となっているので、容易に実装することが可能となる。また、符号化装置で符号化データを生成するときの処理を共通化することができる。
本発明に係る画像復号装置では、上記マージ/スキップレベル情報は、マージまたはスキップの対象となる情報の数が多いレベルほど短い符号が割り当てられていてもよい。
上記の構成によれば、対象となる情報が多いレベルほど短い符号が割り当てられるので、符号化データの符号量をより削減することができる。
本発明に係る画像復号装置では、上記予測画像の生成、変換、符号化を行う単位がそれぞれ異なっており、上記符号化データには、上記単位毎にデータが含まれており、上記マージ/スキップ情報と上記マージ/スキップレベル情報とは、上記単位のうち、異なる単位に含まれていてもよい。
上記の構成によれば、マージ/スキップ情報と上記マージ/スキップレベル情報とが、異なる単位で伝送されるので、サイド情報の符号量を削減することができる。
ここで、サイド情報とは、予測残差を除くすべての情報のことをいう。
本発明に係る画像復号装置では、上記推定手段は、上記復号手段が過去に復号した復号結果に基づいて、マージ/スキップの対象の情報を推定するために参照する参照変換単位を設定するものであってもよい。
上記の構成によれば、推定手段は、過去の復号結果を用いて、参照変換単位を設定する。そして、過去の復号結果は、現在と同様の可能性が高い。よって、適切に参照変換単位を設定することができる。
本発明に係る画像復号装置では、上記マージ/スキップ情報により、マージまたはスキップの対象となる情報を示す対象情報を、上記符号化データのヘッダ部分に格納しているものであってもよい。
上記の構成によれば、マージまたはスキップの対象を適切に設定することができる。
本発明に係る画像復号装置では、上記マージ/スキップレベル情報は、対象となる情報が含まれる上記単位のサイズが閾値より大きい場合のみ、上記符号化データに含まれるものであってもよい。
上記の構成によれば、単位のサイズが小さい場合は、マージ/スキップレベル情報を伝送しないので、単位のサイズが小さい場合のサイド情報が大きくなってしまうことを防止することができる。
本発明に係る画像復号装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データを復号することにより画像を復号する画像復号装置であって、上記符号化データには、上記変換単位毎に、上記変換に用いる変換情報を符号化した符号化変換情報が含まれており、上記符号化データに、上記変換単位毎に、上記変換情報および上記量子化変換係数をマージまたはスキップするマージ/スキップ情報が含まれている場合、上記マージ/スキップ情報が示す方法で、当該変換単位の上記変換情報および上記量子化変換係数を推定する推定手段を備えている。
上記の構成によれば、変換単位で、マージ/またはスキップを行うことできるので、より符号化データの符号量を削減することができる。
上記課題を解決するために、本発明に係る画像符号化装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データを出力する画像符号化装置であって、上記符号化データに、上記量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報を含める符号化手段を備えていることを特徴としている。
上記の構成によれば、周波数領域の変換係数の存在の有無を示す情報を含めずに、マージ/スキップ情報のみを含めた符号化データを出力する。
よって、従来であれば、出力することが必要であった周波数領域の変換係数の存在の有無を示す情報を符号化データに含めずに済むので、符号化データの符号量を従来よりも削減することが可能となる。
本発明に係る符号化データのデータ構造は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データのデータ構造であって、上記量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報を含む。
上記の構成によれば、周波数領域の変換係数の存在の有無を示す情報を含めずに、マージ/スキップ情報のみを含めた符号化データとなる。
よって、従来であれば、必要であった周波数領域の変換係数の存在の有無を示す情報を符号化データに含めずに済むので、符号化データの符号量を従来よりも削減することが可能となる。
(付記事項8)
本発明は以下のように記載することもできる。
本発明に係る画像復号装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子化変換係数を含む符号化データを復号することにより画像を復号する画像復号装置であって、上記変換単位を分割して得られる部分単位について、当該部分単位に非ゼロ変換係数が含まれているか否かを示す非ゼロ変換係数存否情報を推定、または、上記符号化データから復号し、該非ゼロ変換係数存否情報が当該部分単位内に非ゼロ変換係数が存在することを示す場合、当該部分単位を含む復号単位内の各変換係数を上記符号化データから復号する復号手段を備えていることを特徴としている。
上記の構成によれば、変換単位を分割した部分単位について、非ゼロ変換係数存否情報を推定、または復号し、非ゼロ変換係数存否情報が非ゼロ変換係数が存在することを示す場合に、当該部分単位を含む復号単位内の変換係数を復号するので、非ゼロ変換係数の存否の判断を部分単位で行うことができる。
本発明に係る画像復号装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データを復号することにより画像を復号する画像復号装置であって、上記符号化データに、上記量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報が含まれている場合、上記存否情報を復号しない復号手段と、上記符号化データに、上記存否情報をマージまたはスキップするマージ/スキップ情報が含まれている場合、該存否情報を推定する推定手段とを備え、上記復号手段は、上記推定手段が推定した存否情報を用いて上記符号化量子化変換係数を復号することを特徴としている。
ここで、マージとは、復号に必要な所定の情報を省略し、既定または指定された位置にある情報に基づき推定されることをいう。また、スキップとは、復号に必要な所定の情報を省略し、推定値または既定値を代わりに用いることをいう。
上記の構成によれば、周波数領域の変換係数の存在の有無を示す情報を伝送せずに、マージ/スキップ情報のみを伝送することで復号を行うことができる。
よって、従来であれば、伝送することが必要であった周波数領域の変換係数の存在の有無を示す情報を伝送せずに済むので、符号化データの符号量を従来よりも削減することが可能となる。
本発明に係る画像復号装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データを復号することにより画像を復号する画像復号装置であって、上記符号化データには、上記変換単位毎に、上記変換に用いる変換情報を符号化した符号化変換情報が含まれており、上記符号化データに、上記変換単位毎に、上記変換情報および上記量子化変換係数をマージまたはスキップするマージ/スキップ情報が含まれている場合、上記マージ/スキップ情報が示す方法で、当該変換単位の上記変換情報および上記量子化変換係数を推定する推定手段を備えていることを特徴としている。
上記の構成によれば、変換単位で、マージ/またはスキップを行うことできるので、より符号化データの符号量を削減することができる。
本発明に係る画像符号化装置は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データを出力する画像符号化装置であって、上記符号化データに、上記量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報を含める符号化手段を備えていることを特徴としている。
上記の構成によれば、周波数領域の変換係数の存在の有無を示す情報を含めずに、マージ/スキップ情報のみを含めた符号化データを出力する。
よって、従来であれば、出力することが必要であった周波数領域の変換係数の存在の有無を示す情報を符号化データに含めずに済むので、符号化データの符号量を従来よりも削減することが可能となる。
本発明に係る符号化データのデータ構造は、原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子変換係数を含む符号化データのデータ構造であって、上記量子化変換係数に周波数領域の変換係数が含まれるか否か示す存否情報をマージまたはスキップするマージ/スキップ情報を含むことを特徴としている。
上記の構成によれば、周波数領域の変換係数の存在の有無を示す情報を含めずに、マージ/スキップ情報のみを含めた符号化データとなる。
よって、従来であれば、必要であった周波数領域の変換係数の存在の有無を示す情報を符号化データに含めずに済むので、符号化データの符号量を従来よりも削減することが可能となる。
本発明は、符号化データを復号する復号装置、および、符号化データを生成する符号化装置に好適に適用することができる。また、符号化装置によって生成され、復号装置によって参照される符号化データのデータ構造に好適に適用することができる。
1 動画像復号装置(画像復号装置)
2 動画像符号化装置(画像符号化装置)
10 TBLK復号部(復号手段)
11 TBLK情報復号部
12 CU情報復号部
13 PT情報復号部
14 TT情報復号部(復号手段)
15 CU画像生成部
16 TBLK画像生成部
31 CU情報推定部
32 PT情報推定部
33 TT情報推定部(推定手段)
52 TBLK符号化部(符号化手段)

Claims (4)

  1. 原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子化変換係数を含む符号化データを復号単位毎に復号することにより画像を復号する画像復号装置であって、
    上記変換単位は、符号化単位を階層的に分割することにより形成されるものであり、
    上記変換単位を分割して得られる部分単位は、上記変換単位とは異なり、該部分単位のサイズは、上記変換単位のサイズ以下であり、さらに、上記部分単位は、上記変換単位を正方形の格子状に分割して得られる4×4画素から成る単位であり、
    当該部分単位に非ゼロ変換係数が含まれているか否かを示す非ゼロ変換係数存否情報を推定、または、当該非ゼロ変換係数存否情報を上記符号化データから復号し、該非ゼロ変換係数存否情報が当該部分単位内に非ゼロ変換係数が存在することを示す場合、当該部分単位内の変換係数を上記符号化データから復号する復号手段を備え、
    上記復号手段は、上記部分単位が対応する変換単位において処理順で最後の部分単位である場合、当該部分単位について非ゼロ変換係数が存在すると推定することを特徴とする画像復号装置。
  2. 上記復号手段は、参照先の部分単位における非ゼロ変換係数存否情報に基づいて、対象となる上記部分単位の非ゼロ変換係数存否情報を推定することを特徴とする請求項1に記載の画像復号装置。
  3. 原画像から予測画像を減算した予測残差を変換単位毎に変換し量子化した量子化変換係数を符号化した符号化量子化変換係数を含む符号化データを出力する画像符号化装置であって、
    上記符号化データに、上記変換単位を分割して得られる部分単位について、当該部分単位に非ゼロ変換係数が含まれているか否かを示す非ゼロ変換係数存否情報をマージまたはスキップするマージ/スキップ情報を含める符号化手段を備えていることを特徴とする画像符号化装置。
  4. 上記部分単位は、上記変換単位を正方形の格子状に分割して得られる単位であることを特徴とする請求項3に記載の画像符号化装置。


JP2017084008A 2011-03-10 2017-04-20 画像復号装置 Active JP6483183B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2011053611 2011-03-10
JP2011053611 2011-03-10

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013503573A Division JPWO2012121284A1 (ja) 2011-03-10 2012-03-07 画像復号装置、画像符号化装置、および符号化データのデータ構造

Publications (2)

Publication Number Publication Date
JP2017147750A true JP2017147750A (ja) 2017-08-24
JP6483183B2 JP6483183B2 (ja) 2019-03-13

Family

ID=46798240

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013503573A Pending JPWO2012121284A1 (ja) 2011-03-10 2012-03-07 画像復号装置、画像符号化装置、および符号化データのデータ構造
JP2017084008A Active JP6483183B2 (ja) 2011-03-10 2017-04-20 画像復号装置

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013503573A Pending JPWO2012121284A1 (ja) 2011-03-10 2012-03-07 画像復号装置、画像符号化装置、および符号化データのデータ構造

Country Status (6)

Country Link
US (2) US10148974B2 (ja)
EP (2) EP3413564A1 (ja)
JP (2) JPWO2012121284A1 (ja)
CN (5) CN107105259B (ja)
HK (1) HK1191484A1 (ja)
WO (1) WO2012121284A1 (ja)

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3413564A1 (en) * 2011-03-10 2018-12-12 Sharp Kabushiki Kaisha Image decoding device
JP5325360B1 (ja) * 2011-12-15 2013-10-23 パナソニック株式会社 画像符号化方法及び画像符号化装置
AU2012200319B2 (en) 2012-01-19 2015-11-26 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the significance map for residual coefficients of a transform unit
WO2013145021A1 (ja) * 2012-03-30 2013-10-03 株式会社日立製作所 画像復号方法及び画像復号装置
US9432390B2 (en) * 2013-12-31 2016-08-30 Prometheus Security Group Global, Inc. Scene identification system and methods
US10721467B2 (en) * 2015-05-05 2020-07-21 Lg Electronics Inc. Method and device for processing coding unit in image coding system
US9942548B2 (en) * 2016-02-16 2018-04-10 Google Llc Entropy coding transform partitioning information
CN109479131B (zh) * 2016-06-24 2023-09-01 世宗大学校产学协力团 视频信号处理方法及装置
WO2018066991A1 (ko) 2016-10-04 2018-04-12 김기백 영상 데이터 부호화/복호화 방법 및 장치
US20190238888A1 (en) * 2017-07-17 2019-08-01 Ki Baek Kim Image data encoding/decoding method and apparatus
US11284076B2 (en) * 2017-03-22 2022-03-22 Electronics And Telecommunications Research Institute Block form-based prediction method and device
CN114422780A (zh) * 2017-04-28 2022-04-29 夏普株式会社 图像解码装置以及图像编码装置
KR102524628B1 (ko) 2018-01-05 2023-04-21 에스케이텔레콤 주식회사 영상을 부호화 또는 복호화하는 방법 및 장치
CN115022631A (zh) 2018-01-05 2022-09-06 Sk电信有限公司 对视频进行编码或解码的方法和非暂时性计算机可读介质
US11445187B2 (en) * 2018-02-28 2022-09-13 Sharp Kabushiki Kaisha Systems and methods for partitioning regions of a picture for video coding using different coding unit sizes
US10645396B2 (en) * 2018-06-04 2020-05-05 Tencent America LLC Method and apparatus for implicit transform splitting
WO2020013532A1 (ko) * 2018-07-13 2020-01-16 한국전자통신연구원 영상 부호화/복호화 방법, 장치 및 비트스트림을 저장한 기록 매체
EP3873093A4 (en) * 2018-10-23 2022-07-20 Wilus Institute of Standards and Technology Inc. METHOD AND APPARATUS FOR PROCESSING A VIDEO SIGNAL USING SUBBLOCK-BASED MOTION COMPENSATION
JP2022016726A (ja) * 2018-11-16 2022-01-25 ソニーグループ株式会社 画像処理装置および方法
EP3881546A4 (en) 2018-12-04 2022-01-26 Huawei Technologies Co., Ltd. VIDEO ENCODER, VIDEO DECODER, AND CORRESPONDING METHOD
US11234007B2 (en) * 2019-01-05 2022-01-25 Tencent America LLC Method and apparatus for video coding
WO2020182213A1 (en) * 2019-03-13 2020-09-17 Beijing Bytedance Network Technology Co., Ltd. Sub-block transform in transform skip mode
JP7189854B2 (ja) * 2019-09-19 2022-12-14 Kddi株式会社 画像復号装置、画像復号方法及びプログラム
CN111160348A (zh) * 2019-11-20 2020-05-15 中国科学院深圳先进技术研究院 自然场景的文本识别方法、存储装置和计算机设备

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005504A (ja) * 2006-06-22 2008-01-10 Samsung Electronics Co Ltd フラグエンコード方法、フラグデコード方法、および前記方法を用いた装置
WO2009151232A2 (ko) * 2008-06-13 2009-12-17 삼성전자 주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
WO2010039733A2 (en) * 2008-10-03 2010-04-08 Qualcomm Incorporated Video coding with large macroblocks
WO2011019253A2 (en) * 2009-08-14 2011-02-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding video in consideration of scanning order of coding units having hierarchical structure, and method and apparatus for decoding video in consideration of scanning order of coding units having hierarchical structure
WO2011053020A2 (en) * 2009-10-28 2011-05-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding residual block, and method and apparatus for decoding residual block
WO2011121843A1 (ja) * 2010-03-30 2011-10-06 株式会社 東芝 画像符号化及び画像復号化方法
WO2012121284A1 (ja) * 2011-03-10 2012-09-13 シャープ株式会社 画像復号装置、画像符号化装置、および符号化データのデータ構造

Family Cites Families (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4025570B2 (ja) * 2002-04-03 2007-12-19 日本電信電話株式会社 動画像符号化方法、動画像復号方法、動画像符号化装置、動画像復号装置、動画像符号化プログラム、動画像復号プログラム、動画像符号化プログラムを記録した記録媒体、動画像復号プログラムを記録した記録媒体
US7630440B2 (en) * 2003-05-28 2009-12-08 Broadcom Corporation Context adaptive binary arithmetic code decoding engine
CN100344163C (zh) * 2004-06-16 2007-10-17 华为技术有限公司 视频编解码处理方法
EP1829223B1 (en) * 2004-12-22 2013-02-13 LG Electronics Inc. Parallel, layered decoding for Low-Density Parity-Check (LDPC) codes
WO2006118288A1 (ja) * 2005-05-03 2006-11-09 Matsushita Electric Industrial Co., Ltd. 動画像符号化方法、動画像復号化方法およびその装置
DK2123052T3 (da) * 2007-01-18 2011-02-28 Fraunhofer Ges Forschung Kvalitetsskalerbar videodatastrøm
WO2008127597A2 (en) * 2007-04-12 2008-10-23 Thomson Licensing Method and apparatus for context dependent merging for skip-direct modes for video encoding and decoding
KR101431545B1 (ko) * 2008-03-17 2014-08-20 삼성전자주식회사 영상의 부호화, 복호화 방법 및 장치
US8897359B2 (en) * 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
WO2010018992A2 (en) 2008-08-12 2010-02-18 Lg Electronics Inc. Method of processing a video signal
RU2546325C2 (ru) * 2009-05-29 2015-04-10 Мицубиси Электрик Корпорейшн Устройство кодирования изображений, устройство декодирования изображений, способ кодирования изображений и способ декодирования изображений
KR101805531B1 (ko) * 2009-06-07 2018-01-10 엘지전자 주식회사 비디오 신호의 디코딩 방법 및 장치
US9635368B2 (en) 2009-06-07 2017-04-25 Lg Electronics Inc. Method and apparatus for decoding a video signal
US8588296B2 (en) * 2009-07-02 2013-11-19 Dialogic Corporation Bitrate control algorithm for video transcoding systems
CN101959064B (zh) * 2009-07-14 2012-05-30 炬力集成电路设计有限公司 一种视频解码方法及装置
KR101483750B1 (ko) * 2009-07-24 2015-01-19 삼성전자주식회사 영상의 부호화 방법 및 장치, 영상 복호화 방법 및 장치
KR20110014000A (ko) * 2009-08-04 2011-02-10 광운대학교 산학협력단 영상 데이터의 디블록킹 필터링 장치 및 방법과 이를 이용한 영상 복호화 장치 및 방법
US8780978B2 (en) * 2009-11-04 2014-07-15 Qualcomm Incorporated Controlling video encoding using audio information
US20110292997A1 (en) * 2009-11-06 2011-12-01 Qualcomm Incorporated Control of video encoding based on image capture parameters
US10178406B2 (en) * 2009-11-06 2019-01-08 Qualcomm Incorporated Control of video encoding based on one or more video capture parameters
US20110249742A1 (en) * 2010-04-07 2011-10-13 Apple Inc. Coupled video pre-processor and codec including reference picture filter that minimizes coding expense during pre-processing mode transitions
US8665959B2 (en) * 2010-04-12 2014-03-04 Qualcomm Incorporated Block and partition signaling techniques for video coding
JP5798556B2 (ja) * 2010-07-15 2015-10-21 シャープ株式会社 復号装置、符号化装置
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008005504A (ja) * 2006-06-22 2008-01-10 Samsung Electronics Co Ltd フラグエンコード方法、フラグデコード方法、および前記方法を用いた装置
WO2009151232A2 (ko) * 2008-06-13 2009-12-17 삼성전자 주식회사 영상 부호화 방법 및 그 장치, 영상 복호화 방법 및 그 장치
WO2010039733A2 (en) * 2008-10-03 2010-04-08 Qualcomm Incorporated Video coding with large macroblocks
WO2011019253A2 (en) * 2009-08-14 2011-02-17 Samsung Electronics Co., Ltd. Method and apparatus for encoding video in consideration of scanning order of coding units having hierarchical structure, and method and apparatus for decoding video in consideration of scanning order of coding units having hierarchical structure
WO2011053020A2 (en) * 2009-10-28 2011-05-05 Samsung Electronics Co., Ltd. Method and apparatus for encoding residual block, and method and apparatus for decoding residual block
WO2011121843A1 (ja) * 2010-03-30 2011-10-06 株式会社 東芝 画像符号化及び画像復号化方法
WO2012121284A1 (ja) * 2011-03-10 2012-09-13 シャープ株式会社 画像復号装置、画像符号化装置、および符号化データのデータ構造

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
BENJAMIN BROSS ET AL.: "WD5: Working Draft 5 of High-Efficiency Video Coding", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-G1103_d9, JPN6018025730, February 2012 (2012-02-01), pages 40 - 49, ISSN: 0003909671 *
BIN LI ET AL.: "Redundancy reduction in Cbf and Merging coding", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-C277_r2, JPN6018006477, October 2010 (2010-10-01), pages 1 - 8, XP055091761, ISSN: 0003909670 *
BUMSHIK LEE ET AL.: "Improved side information signaling for quad-tree based transform structure of TMuC", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-C068_r1, JPN6018006474, October 2010 (2010-10-01), pages 1 - 5, ISSN: 0003909669 *
JEONGYEON LIM ET AL.: "Description of video coding technology proposal by SK telecom, Sejong Univ. and Sungkyunkwan Univ.", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-A113, JPN6018006481, April 2010 (2010-04-01), pages 1 - 22, ISSN: 0003909667 *
MARTIN WINKEN ET AL.: "Description of video coding technology proposal by Fraunhofer HHI", JOINT COLLABORATIVE TEAM ON VIDEO CODING (JCT-VC) OF ITU-T SG16 WP3 AND ISO/IEC JTC1/SC29/WG11, vol. JCTVC-A116, JPN6018006470, April 2010 (2010-04-01), pages 1 - 17, ISSN: 0003909668 *

Also Published As

Publication number Publication date
CN107105259A (zh) 2017-08-29
JP6483183B2 (ja) 2019-03-13
CN107105259B (zh) 2021-12-28
US10148974B2 (en) 2018-12-04
CN107087178B (zh) 2021-12-28
CN107087179B (zh) 2021-04-27
CN103460694A (zh) 2013-12-18
JPWO2012121284A1 (ja) 2014-07-17
CN107087178A (zh) 2017-08-22
US20130343455A1 (en) 2013-12-26
WO2012121284A1 (ja) 2012-09-13
HK1191484A1 (zh) 2014-07-25
EP2685718B1 (en) 2018-08-29
US10547861B2 (en) 2020-01-28
CN107087179A (zh) 2017-08-22
CN107071439A (zh) 2017-08-18
US20180295360A1 (en) 2018-10-11
EP2685718A4 (en) 2015-03-11
CN107071439B (zh) 2021-12-28
EP3413564A1 (en) 2018-12-12
EP2685718A1 (en) 2014-01-15
CN103460694B (zh) 2017-02-15

Similar Documents

Publication Publication Date Title
JP6483183B2 (ja) 画像復号装置
KR101654446B1 (ko) 화상 복호 장치, 화상 부호화 장치 및 부호화 데이터의 데이터 구조
US20240171764A1 (en) Image decoding device and image coding device
US10136161B2 (en) DMM prediction section, image decoding device, and image coding device
TW202133613A (zh) 圖像解碼裝置及圖像編碼裝置
WO2012077719A1 (ja) 画像復号装置、および画像符号化装置
JP2013141094A (ja) 画像復号装置、画像符号化装置、画像フィルタ装置、および符号化データのデータ構造
WO2012147947A1 (ja) 画像復号装置、および画像符号化装置
JP2013251827A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
JP2016076904A (ja) Dcオフセット情報復号装置、画像復号装置、およびdcオフセット情報符号化装置。
WO2012043676A1 (ja) 復号装置、符号化装置、および、データ構造

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180215

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180227

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180411

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180606

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180710

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20180828

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181004

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181106

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190115

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190213

R150 Certificate of patent or registration of utility model

Ref document number: 6483183

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150