JP6560702B2 - 算術復号装置、算術符号化装置、算術復号方法、および、算術符号化方法 - Google Patents

算術復号装置、算術符号化装置、算術復号方法、および、算術符号化方法 Download PDF

Info

Publication number
JP6560702B2
JP6560702B2 JP2017040790A JP2017040790A JP6560702B2 JP 6560702 B2 JP6560702 B2 JP 6560702B2 JP 2017040790 A JP2017040790 A JP 2017040790A JP 2017040790 A JP2017040790 A JP 2017040790A JP 6560702 B2 JP6560702 B2 JP 6560702B2
Authority
JP
Japan
Prior art keywords
context
unit
frequency
sub
block
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017040790A
Other languages
English (en)
Other versions
JP2017123685A (ja
Inventor
知宏 猪飼
知宏 猪飼
将伸 八杉
将伸 八杉
山本 智幸
智幸 山本
健史 筑波
健史 筑波
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Publication of JP2017123685A publication Critical patent/JP2017123685A/ja
Application granted granted Critical
Publication of JP6560702B2 publication Critical patent/JP6560702B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/117Filters, e.g. for pre-processing or post-processing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/124Quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/137Motion inside a coding unit, e.g. average field, frame or block difference
    • H04N19/139Analysis of motion vectors, e.g. their magnitude, direction, variance or reliability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/157Assigned coding mode, i.e. the coding mode being predefined or preselected to be further used for selection of another element or parameter
    • H04N19/159Prediction type, e.g. intra-frame, inter-frame or bidirectional frame prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/91Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/172Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a picture, frame or field
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/436Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation using parallelised computational arrangements

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、算術符号化された符号化データを復号する算術復号装置に関する。また、算術符号化された符号化データを生成する算術符号化装置に関する。また、算術符号化された符号化データを復号する算術復号方法に関する。また、算術符号化された符号化データを生成する算術符号化方法に関する。
動画像を効率的に伝送または記録するために、動画像を符号化することによって符号化データを生成する動画像符号化装置(画像符号化装置)、および、当該符号化データを復号することによって復号画像を生成する動画像復号装置(画像復号装置)が用いられている。
具体的な動画像符号化方式としては、例えば、H.264/MPEG−4.AVC、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている方式、TMuC(Test Model under Consideration)ソフトウェアに採用されている方式や、その後継コーデックであるHEVC(High-Efficiency Video Coding)にて提案されている方式(非特許文献1)などが挙げられる。
このような動画像符号化方式においては、動画像を構成する画像(ピクチャ)は、画像を分割することにより得られるスライス、スライスを分割することにより得られる符号化単位(コーディングユニット(Coding Unit)と呼ばれることもある)、及び、符号化単位を分割することより得られるブロックおよびパーティションからなる階層構造により管理され、普通、ブロックごとに符号化/復号される。
また、このような符号化方式においては、通常、入力画像を符号化及び復号することによって得られる局所復号画像に基づいて予測画像が生成され、当該予測画像と入力画像との差分画像(「残差画像」または「予測残差」と呼ぶこともある)をブロック毎にDCT(Discrete Cosine Transform)変換等の周波数変換を施すことによって得られる変換係数が符号化される。
変換係数の具体的な符号化の方式としては、コンテキスト適応型可変長符号化(CAVLC:Context-based Adaptive Variable Length Coding)、および、コンテキスト適応型2値算術符号化(CABAC:Context-based Adaptive Binary Arithmetic Coding)が知られている。
CALVCでは、各変換係数を順次スキャンすることによって1次元のベクトルとした後、各変換係数の値を示すシンタックス、および、連続する0の長さ(ランとも呼ぶ)を表すシンタックス等が符号化される。
CABACでは、変換係数を表す各種のシンタックスに対して2値化処理が施され、この2値化処理によって得られた2値データが算術符号化される。ここで、上記各種のシンタックスとしては、変換係数が0であるか否かを示すフラグ、すなわち非0変換係数の有無を示すフラグsignificant_coeff_flag(変換係数有無フラグとも呼ぶ)、並びに、処理順で最後の非0変換係数の位置を示すシンタックスlast_significant_coeff_x及びlast_significant_coeff_yなどが挙げられる。
また、CABACでは、シンボル(2値データの1ビット、Binとも呼ぶ)を1つ符号化する際、処理対象の周波数成分に割り付けられたコンテキストインデックスが参照され、当該コンテキストインデックスによって指定されるコンテキスト変数に含まれる確率状態インデックスの指し示す発生確率に応じた算術符号化が行われる。また、確率状態インデックスによって指定される発生確率は、シンボルを1つ符号化する毎に更新される。
非特許文献1には、(1)16×16画素や32×32画素等の比較的大きなブロックについての周波数領域を複数の部分領域に分割し、(2)低周波数側の部分領域に含まれる周波数成分に対して、周波数領域内での当該周波数成分の位置に応じて定まるコンテキストインデックス(位置コンテキストとも呼ぶ)を割り付け、(3)高周波数側の部分領域に含まれる周波数成分に対して、当該周波数成分の周辺の周波数成分における非0変換係数の数に応じて定まるコンテキストインデックス(周辺参照コンテキストとも呼ぶ)を割り付けることが記載されている。この技術によれば、低周波数側での処理量を低減しつつ、高周波数側において、参照されるコンテキストの総数を小さく保つことができる。
また、非特許文献2では、変換係数の符号化において、算術符号化を用いつつも、コンテキストを用いないバイパスと呼ばれる符号化(すなわち、算術符号化であってコンテキストを用いない符号化)を用いることにより、コンテキストのアップデートを不要としスループットを向上させる技術が知られている。本技術では、従来CABACで用いられていたバイナリ化を用いず、CAVLCで用いていたバイナリ化を用いる。
「WD4: Working Draft 4 of High-Efficiency Video Coding (JCTVC-F803_d2)」, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 6th Meeting: Torino, IT, 14-22 July, 2011(2011年10月8日公開) J. Lainema, K. Ugur and A. Hallapuro「Single entropy coder for HEVC with a high throughput binarization mode」、JCTVC-G569, Geneva, Novemver2011(2011年11月公開)
しかしながら、非特許文献1に記載の技術では、成分数の多い高周波数側において、周辺参照コンテキストを用いるため、非0変換係数の有無を示すフラグsignificant_coeff_flagを復号するためのコンテキスト計算の計算量が増大し、復号処理の遅延を招来するという問題を生じていた。
また、非特許文献2に記載の技術では、CAVLCで用いられるバイナリ化を用いるため、ランモードとレベルモードという2つのモードを必要とし処理が複雑になるという課題がある。また、コンテキストを全く用いないため、符号化効率の低下が大きいという課題がある。
本発明は、上記の問題に鑑みてなされたものであり、その目的は、高い符号化効率を実現しつつ、従来の構成に比べて処理量を低減させることのできる算術復号装置及び算術符号化装置を実現することにある。
上記の課題を解決するために、本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換して得られる変換係数の符号化データを算術復号する算術復号装置において、前記変換係数を示す少なくとも第1のシンタックス及び第2のシンタックスのそれぞれを、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により復号するシンタックス復号手段を備え、前記シンタックス復号手段は、前記第1のシンタックスを復号せずに、前記第2のシンタックスを前記コンテキストを用いない算術復号により復号する場合と、前記第1のシンタックスを前記コンテキストを用いた算術復号により復号し、前記第2のシンタックスをコンテキストを用いない算術復号により復号する場合とを少なくとも含むことを特徴とする。
上記の課題を解決するために、本発明の一態様に係る算術符号化装置は、対象画像を単位領域毎に周波数変換して得られる変換係数の符号化データを生成する算術符号化装置であって、前記変換係数を示す少なくとも第1のシンタックス及び第2のシンタックスのそれぞれを、コンテキストを用いた算術符号化又はコンテキストを用いない算術符号化により算術符号化するシンタックス符号化手段を備え、前記シンタックス符号化手段は、前記第1のシンタックスを符号化せずに、前記第2のシンタックスを前記コンテキストを用いない算術符号化により符号化する場合と、前記第1のシンタックスを前記コンテキストを用いた算術符号化により符号化し、前記第2のシンタックスをコンテキストを用いない算術符号化により符号化する場合とを少なくとも含むことを特徴とする。
上記の課題を解決するために、本発明の一態様に係る算術復号方法は、対象画像を単位領域毎に周波数変換して得られる変換係数の符号化データを算術復号する算術復号方法において、前記変換係数を示す少なくとも第1のシンタックス及び第2のシンタックスのそれぞれを、コンテキストを用いた算術復号又はコンテキストを用いない算術復号により復号するステップを少なくとも含み、前記復号するステップは、前記第1のシンタックスを復号せずに、前記第2のシンタックスを前記コンテキストを用いない算術復号により復号する場合と、前記第1のシンタックスを前記コンテキストを用いた算術復号により復号し、前記第2のシンタックスをコンテキストを用いない算術復号により復号する場合とを少なくとも含むことを特徴とする。
本発明の一態様によれば、高い符号化効率を実現しつつ、処理量を削減することができる。
本発明の実施形態に係る動画像復号装置の備える量子化残差情報復号部の構成を示すブロック図である。 本発明の実施形態に係る動画像符号化装置によって生成され、動画像復号装置によって復号される符号化データのデータ構成を示す図であり、(a)〜(d)は、それぞれ、ピクチャレイヤ、スライスレイヤ、ツリーブロックレイヤ、およびCUレイヤを示す図である。 PU分割タイプのパターンを示す図である。(a)〜(h)は、それぞれ、PU分割タイプが、2N×N、2N×nU、2N×nD、2N×N、2N×nU、および、2N×nDの場合のパーティション形状について示している。 正方形のノードを正方形または非正方形に4分木分割する分割方式について示す図である。(a)は、正方形の分割、(b)は、横長の長方形の分割、(c)は、縦長の長方形の分割、(d)は、横長のノードの横長の分割、(e)は、横長のノードの正方形の分割、(f)は、縦長のノードの縦長の分割、および(g)は、縦長のノードの正方形の分割を示している。 実施形態に係る符号化データの量子化残差情報に含まれる各シンタックスを示す図である。 実施形態に係る量子化残差情報復号部の動作を説明するための図であって、(a)は、順スキャンの場合の処理順を示しており、(b)は、逆スキャンの場合の処理順を示しており、(c)は、処理周波数領域における非0の変換係数を例示しており、(d)は、対象周波数領域におけるシンタックスsignificant_coeff_flagの値を例示しており、(e)は、対象周波数領域におけるシンタックスcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、及びcoeff_abs_level_minus3を復号して得られた値を例示しており、(f)は、対象周波数領域におけるシンタックスcoeff_sign_flagの値を例示している。 実施形態に係る動画像復号装置の構成を示すブロック図である。 実施形態に係る動画像復号装置の備える可変長符号復号部の構成を示すブロック図である。 実施形態に係る周波数分類部によって4つの部分領域に分割された周波数領域を示す図である。 実施形態に係る周辺参照コンテキスト導出部の動作を示すための図であって、(a)は、処理順序が逆スキャン順である場合の対象周波数成分xと、対象周波数成分xの位置周辺に設定された参照領域に含まれる参照周波数成分c1〜c5とを表しており、(b)は、処理順序が順スキャン順である場合の対象周波数成分xと、対象周波数成分xの位置周辺に設定された参照領域に含まれる参照周波数成分c1〜c5とを表しており、(c)は、参照領域が対象周波数領域からはみ出している場合を示している。 (a)は、実施形態に係る周波数分類部によって3つの部分領域に分割された周波数領域を示す図であり、(b)は、実施形態に係る周波数分類部によって2つの部分領域に分割された周波数領域を示す図である。 実施形態に係る係数有無フラグ復号部の第2の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第2の構成例を説明するための図であって、(a)は、スキャン列Lxとスキャン列Lx+1とを示しており、(b)は、スキャン列Lxと、スキャン列Lx+1のうちlast_cntx及びlast_cntyをそれぞれカウントする部分とを示している。 実施形態に係る係数有無フラグ復号部の第3の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第3の構成例における周辺参照コンテキスト導出部によって参照される参照領域を示す図であり、(a)〜(b)は参照数が4である参照領域を例示しており、(c)〜(f)は、参照数が3である参照領域を例示しており、(g)〜(h)は、参照数が2である参照領域を例示しており、(i)は、参照数が3である参照領域の他の例を示している。 実施形態に係る係数有無フラグ復号部の第3の構成例を説明するための図であって、対象周波数領域を構成する部分領域R0〜R3のうち、部分領域R2とR3とで一部のコンテキストを共有する場合を示している。 実施形態に係る係数有無フラグ復号部の第4の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第4の構成例を説明するための図であって、対象周波数領域を構成する部分領域R0〜R4のうち、部分領域R2とR3とで一部のコンテキストを共有する場合を示している。 実施形態に係る係数有無フラグ復号部の第5の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第5の構成例を説明するための図であって、スキャン列Lx、スキャン列Lx+1、スキャン列Lx+2を示している。 実施形態に係る係数有無フラグ復号部の第5の構成例を説明するための図であって、(a)〜(c)は、参照数が2である参照領域を例示している。 実施形態に係る係数有無フラグ復号部の第6の構成例を示すブロック図である。 実施形態に係る量子化残差情報復号部の他の構成例を説明するための図であって、周波数領域を分割して得られる低周波数側の部分領域R0’と高周波数側の部分領域R1’とを示している。 実施形態に係る量子化残差情報復号部の他の構成例を説明するためのものであって、(a)は、レベルの各値とそれに対応した制限設定とを示すものであり、(b)は、レベルの各値とそれに応じた閾値の設定とを示すものである。 実施形態に係る量子化残差情報復号部の他の構成例を説明するためのものであって、(a)は、比較例に係る係数有無フラグ復号部によって導出されたコンテキストインデックスの各値を示しており、(b)は、当該構成例に係る係数有無フラグ復号部によって導出されたコンテキストインデックスctxIdxの各値を示しており、(c)は、当該構成例に係る係数有無フラグ復号部によって導出されたctxIdxHの例を示しており、(d)は、当該構成例に係る係数有無フラグ復号部によって導出されたctxIdxVの例を示している。 実施形態に係る動画像符号化装置の構成を示すブロック図である。 実施形態に係る動画像符号化装置の備える可変長符号符号化部の構成を示すブロック図である。 実施形態に係る可変長符号符号化部の備える量子化残差情報符号化部の構成を示すブロック図である。 上記動画像符号化装置を搭載した送信装置、および、上記動画像復号装置を搭載した受信装置の構成について示した図である。(a)は、動画像符号化装置を搭載した送信装置を示しており、(b)は、動画像復号装置を搭載した受信装置を示している。 上記動画像符号化装置を搭載した記録装置、および、上記動画像復号装置を搭載した再生装置の構成について示した図である。(a)は、動画像符号化装置を搭載した記録装置を示しており、(b)は、動画像復号装置を搭載した再生装置を示している。 実施形態に係る係数有無フラグ復号部の第7の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第7〜第9の構成例を説明するための図であって、サブブロックを単位とするスキャンを示すものである。 実施形態に係る係数有無フラグ復号部の第7〜第9の構成例における動作の流れの一例を示すフローチャートである。 実施形態に係る係数有無フラグ復号部の第7〜第9の構成例における動作の流れの他の例を示すフローチャートである。 実施形態に係る係数有無フラグ復号部の第7の構成例の備える周波数分類部による分類処理によって、部分領域R0、R1、及びR2に分割された周波数領域の一例を示す図である。 実施形態に係る係数有無フラグ復号部の第7〜第9の構成例を説明するための図であって、対象周波数成分xの位置周辺に設定された参照領域に含まれる参照周波数成分c1〜c5を示すものである。 実施形態に係る係数有無フラグ復号部の第8の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第8の構成例の備える周波数分類部による分類処理によって、部分領域R0、R1、R2、及びR3に分割された周波数領域の一例を示す図である。 実施形態に係る係数有無フラグ復号部の第8の構成例の備える周波数分類部による分類処理によって、部分領域R0、R1、R2、及びR3に分割された周波数領域の他の例を示す図である。 実施形態に係る係数有無フラグ復号部の第9の構成例を示すブロック図である。 実施形態に係る係数有無フラグ復号部の第9の構成例の備える周波数分類部による分類処理によって、部分領域R0、R1、R2、R3、及びR4に分割された周波数領域の一例を示す図である。 実施形態に係る係数有無フラグ復号部の第9の構成例の備える周波数分類部による分類処理によって、部分領域R0、R1、R2、R3、及びR4に分割された周波数領域の他の例を示す図である。 実施形態に係る係数有無フラグ符号化部の第7〜第9の構成例による動作の流れを示すフローチャートである。 実施形態に係る係数有無フラグ符号化部の第7の構成例を示すブロック図である。 実施形態に係る係数有無フラグ符号化部の第8の構成例を示すブロック図である。 実施形態に係る係数有無フラグ符号化部の第9の構成例を示すブロック図である。 実施形態に係るサブブロック係数有無フラグを説明するための図であって、(a)は、16×16変換ブロックに含まれる合計256個の周波数成分についての量子化残差係数の各値の一例を示しており、(b)は、16×16変換ブロックを4×4サブブロックに分割した場合の各サブブロックを識別するサブブロック番号の一例を示しており、(c)は、量子化残差係数が(a)に示すものであるときの、各サブブロックのサブブロック係数有無フラグの一例を示している。 実施形態に係る係数有無フラグ復号部の備える周波数分類部による分類処理を説明するための図であって、(a)は、輝度値に関する変換係数を復号する際に好適に適用される部分領域分割を示しており、(b)は、色差に関する変換係数を復号する際に好適に適用される部分領域分割を示している。 実施形態に係る係数有無フラグ復号部の第3の構成例の他の構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(a)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部によるコンテキストインデックス導出処理を説明するための図であって、図48(b)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第3の構成例の他の構成例を説明するための図であって、対象周波数成分xの位置周辺に設定された参照領域に含まれる参照周波数成分c1、c2、c5を示すものである。 実施形態に係る係数有無フラグ復号部の第8の構成例の他の構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(a)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第8の構成例の他の構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(b)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第8の構成例の他の構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(a)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第8の構成例の他の構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(b)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第8の構成例の他の構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(a)〜(b)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第8の構成例のコンテキスト更新遅延除去を考慮した構成例によるコンテキストインデックス導出処理を説明するための図である。 実施形態に係る係数有無フラグ復号部の第8の構成例のコンテキスト更新遅延除去を考慮した構成例によるコンテキストインデックス導出処理を説明するための図である。 実施形態に係る係数有無フラグ復号部の第8の構成例のコンテキスト更新遅延除去を考慮した構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(a)〜(b)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 実施形態に係る係数有無フラグ復号部の第8の構成例のコンテキスト更新遅延除去を考慮した構成例によるコンテキストインデックス導出処理を説明するための図であって、図48(a)〜(b)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスを導出する導出処理を示す擬似コードである。 本発明の実施形態に係る動画像復号装置3の備える量子化残差情報復号部の構成を示すブロック図である。 従来技術の符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの前半部分を示す図である。 従来技術の符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの前半部分を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分の通常構成を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分の第1の簡略化構成を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分の第2の簡略化構成を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分の第3の簡略化構成を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分の第4の簡略化構成を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスを示すシンタックステーブルの後半部分の第5の簡略化構成を示す図である。 実施形態に係る符号化データの量子化残差情報に含まれるシンタックスcoeff_abs_minusを示すシンタックスの構成を示す図である。 実施形態に係る簡略化処理フラグcabac_lowcomp_flagの導出処理を示すフローチャートである。 実施形態に係る簡略化処理フラグcabac_lowcomp_flagの導出処理の詳細処理を示すフローチャートである。 本発明の実施形態に係る動画像符号化装置3の備える量子化残差情報符号化部の構成を示すブロック図である。 実施形態に係る係数有無フラグ符号化部Y224の構成を示すブロック図である。
本発明に係る復号装置および符号化装置の一実施形態について図面に基づいて説明すれば以下のとおりである。なお、本実施形態に係る復号装置は、符号化データから動画像を復号するものである。したがって、以下では、これを「動画像復号装置」と呼称する。また、本実施形態に係る符号化装置は、動画像を符号化することによって符号化データを生成するものである。したがって、以下では、これを「動画像符号化装置」と呼称する。
ただし、本発明の適用範囲はこれに限定されるものではない。すなわち、以下の説明からも明らかなように、本発明の特徴は複数のフレームを前提としなくとも成立するものである。すなわち、動画像を対象とするか静止画像を対象とするかを問わず、復号装置一般および符号化装置一般に適用できるものである。
(符号化データ#1の構成)
図2を用いて、動画像符号化装置2によって生成され、動画像復号装置1によって復号される符号化データ#1の構成例について説明する。符号化データ#1は、例示的に、シーケンス、およびシーケンスを構成する複数のピクチャを含む。
シーケンスレイヤでは、処理対象のシーケンスを復号するために、動画像復号装置1が参照するデータの集合が規定されている。シーケンスレイヤにはシーケンスパラメータセットSPS、ピクチャパラメータセットPPS、ピクチャPICTを含んでいる。
符号化データ#1におけるピクチャレイヤ以下の階層の構造を図2に示す。図2の(a)〜(d)は、それぞれ、ピクチャPICTを規定するピクチャレイヤ、スライスSを規定するスライスレイヤ、ツリーブロック(Tree block)TBLKを規定するツリーブロックレイヤ、ツリーブロックTBLKに含まれる符号化単位(Coding Unit;CU)を規定するCUレイヤを示す図である。
(ピクチャレイヤ)
ピクチャレイヤでは、処理対象のピクチャPICT(以下、対象ピクチャとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。ピクチャPICTは、図2の(a)に示すように、ピクチャヘッダPH、及び、スライスS1〜SNSを含んでいる(NSはピクチャPICTに含まれるスライスの総数)。
なお、以下、スライスS1〜SNSのそれぞれを区別する必要が無い場合、符号の添え字を省略して記述することがある。また、以下に説明する符号化データ#1に含まれるデータであって、添え字を付している他のデータについても同様である。
ピクチャヘッダPHには、対象ピクチャの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれている。例えば、動画像符号化装置2が符号化の際に用いた可変長符号化のモードを示す符号化モード情報(entropy_coding_mode_flag)は、ピクチャヘッダPHに含まれる符号化パラメータの一例である。
entropy_coding_mode_flagが0の場合、当該ピクチャPICTは、CAVLC(Context-based Adaptive Variable Length Coding)によって符号化されている。また、entropy_coding_mode_flagが1である場合、当該ピクチャPICTは、CABAC(Context-based Adaptive Binary Arithmetic Coding)によって符号化されている。
(スライスレイヤ)
スライスレイヤでは、処理対象のスライスS(対象スライスとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。スライスSは、図2の(b)に示すように、スライスヘッダSH、及び、ツリーブロックTBLK1〜TBLKNC(NCはスライスSに含まれるツリーブロックの総数)を含んでいる。
スライスヘッダSHには、対象スライスの復号方法を決定するために動画像復号装置1が参照する符号化パラメータ群が含まれる。スライスタイプを指定するスライスタイプ指定情報(slice_type)は、スライスヘッダSHに含まれる符号化パラメータの一例である。
スライスタイプ指定情報により指定可能なスライスタイプとしては、(1)符号化の際にイントラ予測のみを用いるIスライス、(2)符号化の際に単予測、又は、イントラ予測を用いるPスライス、(3)符号化の際に単予測、双予測、又は、イントラ予測を用いるBスライスなどが挙げられる。
また、スライスヘッダSHには、動画像復号装置1の備えるループフィルタによって参照されるフィルタパラメータFPが含まれている。フィルタパラメータFPは、フィルタ係数群を含んでいる。フィルタ係数群には、(1)フィルタのタップ数を指定するタップ数指定情報、(2)フィルタ係数a0〜aNT-1(NTは、フィルタ係数群に含まれるフィルタ係数の総数)、および、(3)オフセットoが含まれる。
(ツリーブロックレイヤ)
ツリーブロックレイヤでは、処理対象のツリーブロックTBLK(以下、対象ツリーブロックとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
ツリーブロックTBLKは、ツリーブロックヘッダTBLKHと、符号化単位情報CU1〜CUNL(NLはツリーブロックTBLKに含まれる符号化単位情報の総数)とを含む。ここで、まず、ツリーブロックTBLKと、符号化単位情報CUとの関係について説明すると次のとおりである。
ツリーブロックTBLKは、イントラ予測またはインター予測、および、変換の各処理ためのブロックサイズを特定するためのユニットに分割される。
ツリーブロックTBLKの上記ユニットは、再帰的な4分木分割により分割されている。この再帰的な4分木分割により得られる木構造のことを以下、符号化ツリー(coding tree)と称する。
以下、符号化ツリーの末端のノードであるリーフ(leaf)に対応するユニットを、符号化ノード(coding node)として参照する。また、符号化ノードは、符号化処理の基本的な単位となるため、以下、符号化ノードのことを、符号化単位(CU)とも称する。
つまり、符号化単位情報CU1〜CUNLは、ツリーブロックTBLKを再帰的に4分木分割して得られる各符号化ノード(符号化単位)に対応する情報である。
また、符号化ツリーのルート(root)は、ツリーブロックTBLKに対応付けられる。換言すれば、ツリーブロックTBLKは、複数の符号化ノードを再帰的に含む4分木分割の木構造の最上位ノードに対応付けられる。
なお、各符号化ノードのサイズは、当該符号化ノードが直接に属する符号化ノード(すなわち、当該符号化ノードの1階層上位のノードのユニット)のサイズの縦横とも半分である。
また、各符号化ノードの取り得るサイズは、符号化データ#1のシーケンスパラメータセットSPSに含まれる、符号化ノードのサイズ指定情報および最大階層深度(maximum hierarchical depth)に依存する。例えば、ツリーブロックTBLKのサイズが64×64画素であって、最大階層深度が3である場合には、当該ツリーブロックTBLK以下の階層における符号化ノードは、4種類のサイズ、すなわち、64×64画素、32×32画素、16×16画素、および8×8画素の何れかを取り得る。
(ツリーブロックヘッダ)
ツリーブロックヘッダTBLKHには、対象ツリーブロックの復号方法を決定するために動画像復号装置1が参照する符号化パラメータが含まれる。具体的には、図2の(c)に示すように、対象ツリーブロックの各CUへの分割パターンを指定するツリーブロック分割情報SP_TBLK、および、量子化ステップの大きさを指定する量子化パラメータ差分Δqp(qp_delta)が含まれる。
ツリーブロック分割情報SP_TBLKは、ツリーブロックを分割するための符号化ツリーを表す情報であり、具体的には、対象ツリーブロックに含まれる各CUの形状、サイズ、および、対象ツリーブロック内での位置を指定する情報である。
なお、ツリーブロック分割情報SP_TBLKは、CUの形状やサイズを明示的に含んでいなくてもよい。例えばツリーブロック分割情報SP_TBLKは、対象ツリーブロック全体またはツリーブロックの部分領域を四分割するか否かを示すフラグ(split_coding_unit_flag)の集合であってもよい。その場合、ツリーブロックの形状やサイズを併用することで各CUの形状やサイズを特定できる。
また、量子化パラメータ差分Δqpは、対象ツリーブロックにおける量子化パラメータqpと、当該対象ツリーブロックの直前に符号化されたツリーブロックにおける量子化パラメータqp’との差分qp−qp’である。
(CUレイヤ)
CUレイヤでは、処理対象のCU(以下、対象CUとも称する)を復号するために動画像復号装置1が参照するデータの集合が規定されている。
ここで、符号化単位情報CUに含まれるデータの具体的な内容の説明をする前に、CUに含まれるデータの木構造について説明する。符号化ノードは、予測ツリー(prediction tree;PT)および変換ツリー(transform tree;TT)のルートのノードとなる。予測ツリーおよび変換ツリーについて説明すると次のとおりである。
予測ツリーにおいては、符号化ノードが1または複数の予測ブロックに分割され、各予測ブロックの位置とサイズとが規定される。別の表現でいえば、予測ブロックは、符号化ノードを構成する1または複数の重複しない領域である。また、予測ツリーは、上述の分割により得られた1または複数の予測ブロックを含む。
予測処理は、この予測ブロックごとに行われる。以下、予測の単位である予測ブロックのことを、予測単位(prediction unit;PU)とも称する。
予測ツリーにおける分割の種類は、大まかにいえば、イントラ予測の場合と、インター予測の場合との2つがある。
イントラ予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)と、N×Nとがある。
また、インター予測の場合、分割方法は、2N×2N(符号化ノードと同一サイズ)、2N×N、N×2N、および、N×Nなどがある。
また、変換ツリーにおいては、符号化ノードが1または複数の変換ブロックに分割され、各変換ブロックの位置とサイズとが規定される。別の表現でいえば、変換ブロックは、符号化ノードを構成する1または複数の重複しない領域のことである。また、変換ツリーは、上述の分割より得られた1または複数の変換ブロックを含む。
変換処理は、この変換ブロックごとに行われる。以下、変換の単位である変換ブロックのことを、変換単位(transform unit;TU)とも称する。
(符号化単位情報のデータ構造)
続いて、図2の(d)を参照しながら符号化単位情報CUに含まれるデータの具体的な内容について説明する。図2の(d)に示すように、符号化単位情報CUは、具体的には、スキップモードフラグSKIP、CU予測タイプ情報Pred_type、PT情報PTI、および、TT情報TTIを含む。
[スキップフラグ]
スキップフラグSKIPは、対象CUについて、スキップモードが適用されているか否かを示すフラグであり、スキップフラグSKIPの値が1の場合、すなわち、対象CUにスキップモードが適用されている場合、その符号化単位情報CUにおけるPT情報PTIは省略される。なお、スキップフラグSKIPは、Iスライスでは省略される。
[CU予測タイプ情報]
CU予測タイプ情報Pred_typeは、CU予測方式情報PredModeおよびPU分割タイプ情報PartModeを含む。CU予測タイプ情報のことを単に予測タイプ情報と呼ぶこともある。
CU予測方式情報PredModeは、対象CUに含まれる各PUについての予測画像生成方法として、イントラ予測(イントラCU)、および、インター予測(インターCU)のいずれを用いるのかを指定するものである。なお、以下では、対象CUにおける、スキップ、イントラ予測、および、インター予測の種別を、CU予測モードと称する。
PU分割タイプ情報PartModeは、対象符号化単位(CU)の各PUへの分割のパターンであるPU分割タイプを指定するものである。以下、このように、PU分割タイプに従って、対象符号化単位(CU)を各PUへ分割することをPU分割と称する。
PU分割タイプ情報PartModeは、例示的には、PU分割パターンの種類を示すインデックスであってもよいし、対象予測ツリーに含まれる各PUの形状、サイズ、および、対象予測ツリー内での位置が指定されていてもよい。
なお、選択可能なPU分割タイプは、CU予測方式とCUサイズに応じて異なる。また、さらにいえば、選択可能できるPU分割タイプは、インター予測およびイントラ予測それぞれの場合において異なる。また、PU分割タイプの詳細については後述する。
また、Iスライスでない場合、PU分割タイプ情報PartModeの値およびPU分割タイプ情報PartModeの値は、ツリーブロックの分割(partition)、予測方式、およびCUの分割(split)の方法の組み合わせを指定するインデックス(cu_split_pred_part_mode)によって特定されるようになっていてもよい。
[PT情報]
PT情報PTIは、対象CUに含まれるPTに関する情報である。言い換えれば、PT情報PTIは、PTに含まれる1または複数のPUそれぞれに関する情報の集合である。上述のとおり予測画像の生成は、PUを単位として行われるので、PT情報PTIは、動画像復号装置1によって予測画像が生成される際に参照される。PT情報PTIは、図2の(d)に示すように、各PUにおける予測情報等を含むPU情報PUI1〜PUINP(NPは、対象PTに含まれるPUの総数)を含む。
予測情報PUIは、予測タイプ情報Pred_modeが何れの予測方法を指定するのかに応じて、イントラ予測パラメータPP_Intra、または、インター予測パラメータPP_Interを含む。以下では、イントラ予測が適用されるPUをイントラPUとも呼称し、インター予測が適用されるPUをインターPUとも呼称する。
インター予測パラメータPP_Interは、動画像復号装置1が、インター予測によってインター予測画像を生成する際に参照される符号化パラメータを含む。
インター予測パラメータPP_Interとしては、例えば、マージフラグ(merge_flag)、マージインデックス(merge_idx)、推定動きベクトルインデックス(mvp_idx)、参照画像インデックス(ref_idx)、インター予測フラグ(inter_pred_flag)、および動きベクトル残差(mvd)が挙げられる。
イントラ予測パラメータPP_Intraは、動画像復号装置1が、イントラ予測によってイントラ予測画像を生成する際に参照される符号化パラメータを含む。
イントラ予測パラメータPP_Intraとしては、例えば、推定予測モードフラグ、推定予測モードインデックス、および、残余予測モードインデックスが挙げられる。
なお、イントラ予測パラメータには、PCMモードを用いるか否かを示すPCMモードフラグが含まれていてもよい。PCMモードフラグが符号化されている場合であって、PCMモードフラグがPCMモードを用いることを示しているときには、予測処理(イントラ)、変換処理、および、エントロピー符号化の各処理が省略される。
[TT情報]
TT情報TTIは、CUに含まれるTTに関する情報である。言い換えれば、TT情報TTIは、TTに含まれる1または複数のTUそれぞれに関する情報の集合であり、動画像復号装置1により残差データを復号する際に参照される。なお、以下、TUのことをブロックと称することもある。
TT情報TTIは、図2の(d)に示すように、対象CUの各変換ブロックへの分割パターンを指定するTT分割情報SP_TU、および、TU情報TUI1〜TUINT(NTは、対象CUに含まれるブロックの総数)を含んでいる。
TT分割情報SP_TUは、具体的には、対象CUに含まれる各TUの形状、サイズ、および、対象CU内での位置を決定するための情報である。例えば、TT分割情報SP_TUは、対象となるノードの分割を行うのか否かを示す情報(split_transform_flag)と、その分割の深度を示す情報(trafoDepth)とから実現することができる。
また、例えば、CUのサイズが、64×64の場合、分割により得られる各TUは、32×32画素から4×4画素までのサイズを取り得る。
TU情報TUI1〜TUINTは、TTに含まれる1または複数のTUそれぞれに関する個別の情報である。例えば、TU情報TUIは、量子化予測残差(量子化残差とも呼ぶ)を含んでいる。
各量子化予測残差は、動画像符号化装置2が以下の処理1〜3を、処理対象のブロックである対象ブロックに施すことによって生成した符号化データである。
処理1:符号化対象画像から予測画像を減算した予測残差を周波数変換(例えばDCT変換(Discrete Cosine Transform))する;
処理2:処理1にて得られた変換係数を量子化する;
処理3:処理2にて量子化された変換係数を可変長符号化する;
なお、上述した量子化パラメータqpは、動画像符号化装置2が変換係数を量子化する際に用いた量子化ステップQPの大きさを表す(QP=2qp/6)。
(PU分割タイプ)
PU分割タイプには、対象CUのサイズを2N×2N画素とすると、次の合計8種類のパターンがある。すなわち、2N×2N画素、2N×N画素、N×2N画素、およびN×N画素の4つの対称的分割(symmetric splittings)、並びに、2N×nU画素、2N×nD画素、nL×2N画素、およびnR×2N画素の4つの非対称的分割(asymmetric splittings)である。なお、N=2m(mは1以上の任意の整数)を意味している。以下、対称CUを分割して得られる領域のことをパーティションとも称する。
図3の(a)〜(h)に、それぞれの分割タイプについて、CUにおけるPU分割の境界の位置を具体的に図示している。
図3の(a)は、CUの分割を行わない2N×2NのPU分割タイプを示している。また、図3の(b)、(c)、および(d)は、それぞれ、PU分割タイプが、それぞれ、2N×N、2N×nU、および、2N×nDである場合のパーティションの形状について示している。また、図3の(e)、(f)、および(g)は、それぞれ、PU分割タイプが、N×2N、nL×2N、および、nR×2Nである場合のパーティションの形状について示している。また、図3の(h)は、PU分割タイプが、N×Nである場合のパーティションの形状を示している。
図3の(a)および(h)のPU分割タイプのことを、そのパーティションの形状に基づいて、正方形分割とも称する。また、図3の(b)〜(g)のPU分割タイプのことは、非正方形分割とも称する。
また、図3の(a)〜(h)において、各領域に付した番号は、領域の識別番号を示しており、この識別番号順に、領域に対して処理が行われる。すなわち、当該識別番号は、領域のスキャン順を表している。
[インター予測の場合の分割タイプ]
インターPUでは、上記8種類の分割タイプのうち、N×N(図3の(h))以外の7種類が定義されている。なお、上記4つの非対称的分割は、AMP(Asymmetric Motion Partition)と呼ばれることもある。
また、Nの具体的な値は、当該PUが属するCUのサイズによって規定され、nU、nD、nL、および、nRの具体的な値は、Nの値に応じて定められる。例えば、128×128画素のインターCUは、128×128画素、128×64画素、64×128画素、64×64画素、128×32画素、128×96画素、32×128画素、および、96×128画素のインターPUへ分割することが可能である。
[イントラ予測の場合の分割タイプ]
イントラPUでは、次の2種類の分割パターンが定義されている。すなわち、対象CUを分割しない、すなわち対象CU自身が1つのPUとして取り扱われる分割パターン2N×2Nと、対象CUを、4つのPUへと対称的に分割するパターンN×Nと、である。
したがって、イントラPUでは、図3に示した例でいえば、(a)および(h)の分割パターンを取ることができる。
例えば、128×128画素のイントラCUは、128×128画素、および、64×64画素のイントラPUへ分割することが可能である。
(TU分割タイプ)
次に、図4を用いて、TU分割タイプについて説明する。TU分割のパターンは、CUのサイズ、分割の深度(trafoDepth)、および対象PUのPU分割タイプにより定まる。
また、TU分割のパターンには、正方形の4分木分割と、非正方形の4分木分割とが含まれる。
図4の(a)〜(c)は、正方形のノードを正方形または非正方形に4分木分割する分割方式について示している。より具体的には、図4の(a)は、正方形のノードを正方形に4分木分割する分割方式を示している。また、同図の(b)は、正方形のノードを横長の長方形に4分木分割する分割方式を示している。そして、同図の(c)は、正方形のノードを縦長の長方形に4分木分割する分割方式を示している。
また、図4の(d)〜(g)は、非正方形のノードを正方形または非正方形に4分木分割する分割方式について示している。より具体的には、図4の(d)は、横長の長方形のノードを横長の長方形に4分木分割する分割方式を示している。また、同図の(e)は、横長の長方形のノードを正方形に4分木分割する分割方式を示している。また、同図の(f)は、縦長の長方形のノードを縦長の長方形に4分木分割する分割方式を示している。そして、同図の(g)は、縦長の長方形のノードを正方形に4分木分割する分割方式を示している。
(量子化残差情報QDの構成)
図5は、量子化残差情報QD(図5ではresidual_coding_cabac()と表記)に含まれる各シンタックスを示す表である。
図5に示すように、量子化残差情報QDは、シンタックスlast_significant_coeff_x、last_significant_coeff_y、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、coeff_abs_level_minus3を含んでいる。
量子化残差情報QDに含まれる各シンタックスは、コンテキスト適応型2値算術符号化(CABAC:(Context-based Adaptive Binary Arithmetic Coding))によって符号化されている。
以下では、図5〜図6を参照して、ブロックサイズが8×8画素である場合を例にとり、各シンタックスの復号手順について説明する。図6(a)〜(g)の横軸は、水平方向周波数xC(0≦xC≦7)を表しており、縦軸は、垂直方向周波数yC(0≦yC≦7)を表している。以下の説明では、周波数領域に含まれる各部分領域のうち、水平方向周波数xC、および、垂直方向周波数yCによって指定される部分領域を、周波数成分(xC、yC)とも呼称する。また、周波数成分(xC、yC)についての変換係数をCoeff(xC、yC)とも表記する。変換係数Coeff(0、0)は、DC成分を示しており、それ以外の変換係数は、DC成分以外の成分を表している。本明細書において、(xC、yC)を(u、v)や(uiPosX、uiPosY)などと表記することもある。
図6(a)〜(b)は、8×8の周波数成分よりなる周波数領域FRにおけるスキャン順の例を示す図である。
図6(a)に示す例では、低周波数側(図6(a)において左上)から高周波数側(図6(a)において右下)に向かって順次スキャンが行われる。また、図6(a)に示す例では、周波数領域FR内に示す矢印に沿ってスキャンが行われる。図6(a)に示すスキャン順を、順スキャンと呼ぶこともある。
一方で、図6(b)に示す例では、高周波数側(図6(b)において右下)から低周波数側(図6(b)において左上)に向かって順次スキャンが行われる。また、図6(b)に示す例では、周波数領域FR内に示す矢印に沿ってスキャンが行われる。図6(b)に示すスキャン順を、逆スキャンと呼ぶこともある。
図6(c)は、8×8の周波数成分よりなる周波数領域における0でない変換係数(非0変化係数)を例示する図である。
シンタックスlast_significant_coeff_x及びlast_significant_coeff_yは、順スキャン方向に沿って最後の非0変換係数の位置を示すシンタックスである。図6(c)に示す例の場合、last_significant_coeff_x=6、last_significant_coeff_y=0である。
シンタックスsignificant_coeff_flagは、非0変換係数を起点として逆スキャン方向に沿った各周波数成分について、非0変換係数の有無を示すシンタックスである。図6(d)は、復号対象の変換係数が、図6(c)に示すものである場合のシンタックスsignificant_coeff_flagの値を示している。図6(d)に示すように、シンタックスsignificant_coeff_flagは、各xC、yCについて、変換係数が0であれば0、変換係数が0でなければ1をとるフラグである。なお、シンタックスsignificant_coeff_flagを変換係数有無フラグとも呼称する。
シンタックスcoeff_abs_level_greater1_flagは、変換係数の絶対値が1を越えるものであるのか否かを示すフラグであり、シンタックスsignificant_coeff_flagの値が1である周波数成分について符号化される。変換係数の絶対値が1を越えるものであるとき、coeff_abs_level_greater1_flagの値は1であり、そうでないときにcoeff_abs_level_greater1_flagの値は0である。
シンタックスcoeff_abs_level_greater2_flagは、変換係数の絶対値が2を越えるものであるのか否かを示すフラグであり、coeff_abs_level_greater1_flagの値が1であるときに符号化される。変換係数の絶対値が2を越えるものであるとき、coeff_abs_level_greater2_flagの値は1であり、そうでないときにcoeff_abs_level_greater2_flagの値は0である。
シンタックスcoeff_abs_level_minus3は、変換係数の絶対値が3以上である場合に、当該変換係数の絶対値を指定するためのシンタックスであり、coeff_abs_level_greater2_flagの値が1であるときに符号化される。シンタックスcoeff_abs_level_minus3の値は、変換係数の絶対値から3を引いたものである。例えば、coeff_abs_level_minus3=1は、変換係数の絶対値が4であることを示している。
図6(e)は、シンタックスcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、及びcoeff_abs_level_minus3を復号することによって得られた各変換係数の絶対値を示している。
シンタックスcoeff_sign_flagは、変換係数の符号(正であるのか負であるのか)を示すフラグであり、シンタックスsignificant_coeff_flagの値が1である周波数成分について符号化される。
図6(f)は、復号対象の変換係数が、図6(c)に示すものである場合のシンタックスcoeff_sign_flagを示す図である。図6(f)に示すように、シンタックスcoeff_sign_flagは、変換係数が正である場合に1をとり、変換係数が負である場合に0をとるフラグである。
動画像復号装置1の備える可変長符号復号部11は、シンタックスlast_significant_coeff_x、last_significant_coeff_y、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、coeff_abs_level_minus3を復号することにより、各周波数成分についての変換係数Coeff(xC、yC)を生成することができる。
なお、特定の領域(例えばTU)内の非0変換係数の集合をsignificance mapと呼ぶこともある。
また、シンタックスcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、coeff_abs_level_minus3の復号は、周波数領域における各周波数成分を、1または複数のグループにグループ分けした後、グループ毎に行なわれる。図6(g)は、8×8の周波数成分よりなる周波数領域におけるグループ分けの例を示している。各種シンタックスの復号処理の詳細については、後述することとし、続いて動画像復号装置1の構成について説明を行う。
(動画像復号装置1)
以下では、本実施形態に係る動画像復号装置1について図1、図7〜図25を参照して説明する。動画像復号装置1は、H.264/MPEG−4 AVC規格に採用されている技術、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている技術、TMuC(Test Model under Consideration)ソフトウェアに採用されている技術、および、その後継コーデックであるHEVC(High-Efficiency Video Coding)にて提案されている技術を実装している復号装置である。
図7は、動画像復号装置1の構成を示すブロック図である。図7に示すように、動画像復号装置1は、可変長符号復号部11、予測画像生成部12、逆量子化・逆変換部13、加算器14、フレームメモリ15、および、ループフィルタ16を備えている。また、図7に示すように、予測画像生成部12は、動きベクトル復元部12a、インター予測画像生成部12b、イントラ予測画像生成部12c、および、予測方式決定部12dを備えている。動画像復号装置1は、符号化データ#1を復号することによって動画像#2を生成するための装置である。
(可変長符号復号部11)
図8は、可変長符号復号部11の要部構成を示すブロック図である。図8に示すように、可変長符号復号部11は、量子化残差情報復号部111、予測パラメータ復号部112、予測タイプ情報復号部113、および、フィルタパラメータ復号部114を備えている。
可変長符号復号部11は、予測パラメータ復号部112にて、各パーティションに関する予測パラメータPPを、符号化データ#1から復号し、予測画像生成部12に供給する。具体的には、予測パラメータ復号部112は、インター予測パーティションに関しては、参照画像インデックス、推定動きベクトルインデックス、及び、動きベクトル残差を含むインター予測パラメータPP_Interを符号化データ#1から復号し、これらを動きベクトル復元部12aに供給する。一方、イントラ予測パーティションに関しては、推定予測モードフラグ、推定予測モードインデックス、および、残余予測モードインデックスを含むイントラ予測パラメータPP_Intraを符号化データ#1から復号し、これらをイントラ予測画像生成部12cに供給する。
また、可変長符号復号部11は、予測タイプ情報復号部113にて、各パーティションについての予測タイプ情報Pred_typeを符号化データ#1から復号し、これを予測方式決定部12dに供給する。更に、可変長符号復号部11は、量子化残差情報復号部111にて、ブロックに関する量子化残差情報QD、及び、そのブロックを含むTUに関する量子化パラメータ差分Δqpを符号化データ#1から復号し、これらを逆量子化・逆変換部13に供給する。また、可変長符号復号部11は、フィルタパラメータ復号部114にて、符号化データ#1からフィルタパラメータFPを復号し、これをループフィルタ16に供給する。なお、量子化残差情報復号部111の具体的な構成については後述するためここでは説明を省略する。
(予測画像生成部12)
予測画像生成部12は、各パーティションについての予測タイプ情報Pred_typeに基づいて、各パーティションがインター予測を行うべきインター予測パーティションであるのか、イントラ予測を行うべきイントラ予測パーティションであるのかを識別する。そして、前者の場合には、インター予測画像Pred_Interを生成すると共に、生成したインター予測画像Pred_Interを予測画像Predとして加算器14に供給し、後者の場合には、イントラ予測画像Pred_Intraを生成すると共に、生成したイントラ予測画像Pred_Intraを加算器14に供給する。なお、予測画像生成部12は、処理対象PUに対してスキップモードが適用されている場合には、当該PUに属する他のパラメータの復号を省略する。
(動きベクトル復元部12a)
動きベクトル復元部12aは、各インター予測パーティションに関する動きベクトルmvを、そのパーティションに関する動きベクトル残差と、他のパーティションに関する復元済みの動きベクトルmv’とから復元する。具体的には、(1)推定動きベクトルインデックスにより指定される推定方法に従って、復元済みの動きベクトルmv’から推定動きベクトルを導出し、(2)導出した推定動きベクトルと動きベクトル残差とを加算することによって動きベクトルmvを得る。なお、他のパーティションに関する復元済みの動きベクトルmv’は、フレームメモリ15から読み出すことができる。動きベクトル復元部12aは、復元した動きベクトルmvを、対応する参照画像インデックスRIと共に、インター予測画像生成部12bに供給する。
(インター予測画像生成部12b)
インター予測画像生成部12bは、画面間予測によって、各インター予測パーティションに関する動き補償画像mcを生成する。具体的には、動きベクトル復元部12aから供給された動きベクトルmvを用いて、同じく動きベクトル復元部12aから供給された参照画像インデックスRIによって指定される適応フィルタ済復号画像P_ALF’から動き補償画像mcを生成する。ここで、適応フィルタ済復号画像P_ALF’は、既にフレーム全体の復号が完了した復号済みの復号画像に対して、ループフィルタ16によるフィルタ処理を施すことによって得られる画像であり、インター予測画像生成部12bは、適応フィルタ済復号画像P_ALF’を構成する各画素の画素値をフレームメモリ15から読み出すことができる。インター予測画像生成部12bによって生成された動き補償画像mcは、インター予測画像Pred_Interとして予測方式決定部12dに供給される。
(イントラ予測画像生成部12c)
イントラ予測画像生成部12cは、各イントラ予測パーティションに関する予測画像Pred_Intraを生成する。具体的には、まず、可変長符号復号部11から供給されたイントラ予測パラメータPP_Intraに基づいて予測モードを特定し、特定された予測モードを対象パーティションに対して、例えば、ラスタスキャン順に割り付ける。
ここで、イントラ予測パラメータPP_Intraに基づく予測モードの特定は、以下のように行うことができる。(1)推定予測モードフラグを復号し、当該推定予測モードフラグが、処理対象である対象パーティションについての予測モードと、当該対象パーティションの周辺のパーティションに割り付けられた予測モードとが同一であることを示している場合には、対象パーティションに対して、当該対象パーティションの周辺のパーティションに割り付けられた予測モードを割り付ける。(2)一方で、推定予測モードフラグが、処理対象である対象パーティションについての予測モードと、当該対象パーティションの周辺のパーティションに割り付けられた予測モードとが同一でないことを示している場合には、残余予測モードインデックスを復号し、当該残余予測モードインデックスの示す予測モードを対象パーティションに対して割り付ける。
イントラ予測画像生成部12cは、対象パーティションに割り付けられた予測モードの示す予測方法に従って、画面内予測によって、(局所)復号画像Pから予測画像Pred_Intraを生成する。イントラ予測画像生成部12cによって生成されたイントラ予測画像Pred_Intraは、予測方式決定部12dに供給される。なお、イントラ予測画像生成部12cは、画面内予測によって、適応フィルタ済復号画像P_ALFから予測画像Pred_Intraを生成する構成とすることも可能である。
(予測方式決定部12d)
予測方式決定部12dは、各パーティションが属するPUについての予測タイプ情報Pred_typeに基づいて、各パーティションがインター予測を行うべきインター予測パーティションであるのか、イントラ予測を行うべきイントラ予測パーティションであるのかを決定する。そして、前者の場合には、インター予測画像生成部12bにて生成されたインター予測画像Pred_Interを予測画像Predとして加算器14に供給し、後者の場合には、イントラ予測画像生成部12cにて生成されたイントラ予測画像Pred_Intraを予測画像Predとして加算器14に供給する。
(逆量子化・逆変換部13)
逆量子化・逆変換部13は、(1)符号化データ#1の量子化残差情報QDから復号された変換係数Coeffを逆量子化し、(2)逆量子化によって得られた変換係数Coeff_IQに対して逆DCT(Discrete Cosine Transform)変換等の逆周波数変換を施し、(3)逆周波数変換によって得られた予測残差Dを加算器14に供給する。なお、量子化残差情報QDから復号された変換係数Coeffを逆量子化する際に、逆量子化・逆変換部13は、可変長符号復号部11から供給された量子化パラメータ差分Δqpから量子化ステップQPを導出する。量子化パラメータqpは、直前に逆量子化及び逆周波数変換したTUに関する量子化パラメータqp’に量子化パラメータ差分Δqpを加算することによって導出でき、量子化ステップQPは、量子化ステップqpから例えばQP=2pq/6によって導出できる。また、逆量子化・逆変換部13による予測残差Dの生成は、TUあるいはTUを分割したブロックを単位として行われる。
なお、逆量子化・逆変換部13によって行われる逆DCT変換は、例えば、対象ブロックのサイズが8×8画素である場合、当該対象ブロックにおける画素の位置を(i、j)(0≦i≦7、0≦j≦7)とし、位置(i、j)における予測残差Dの値をD(i、j)と表すことにし、周波数成分(u、v)(0≦u≦7、0≦v≦7)における逆量子化された変換係数をCoeff_IQ(u、v)を表すことにすると、例えば、以下の数式(1)によって与えられる。
Figure 0006560702
ここで、(u、v)は、上述した(xC、yC)に対応する変数である。C(u)およびC(v)は、以下のように与えられる。
・C(u)=1/√2 (u=0)
・C(u)=1 (u≠0)
・C(v)=1/√2 (v=0)
・C(v)=1 (v≠0)
(加算器14)
加算器14は、予測画像生成部12から供給された予測画像Predと、逆量子化・逆変換部13から供給された予測残差Dとを加算することによって復号画像Pを生成する。生成された復号画像Pは、フレームメモリ15に格納される。
(ループフィルタ16)
ループフィルタ16は、(1)復号画像Pにおけるブロック境界、またはパーティション境界の周辺の画像の平滑化(デブロック処理)を行うデブロッキングフィルタ(DF:Deblocking Filter)としての機能と、(2)デブロッキングフィルタが作用した画像に対して、フィルタパラメータFPを用いて適応フィルタ処理を行う適応フィルタ(ALF:Adaptive Loop Filter)としての機能とを有している。
(量子化残差情報復号部111)
量子化残差情報復号部111は、符号化データ#1に含まれる量子化残差情報QDから、各周波数成分(uiPosX、uiPosY)についての量子化された変換係数Coeff(uiPosX、uiPosY)を復号するための構成である。ここで、uiPosXおよびuiPosYは、周波数領域における各周波数成分の位置を表すインデックスであり、それぞれ、上述した水平方向周波数uおよび垂直方向周波数vに対応するインデックスである。また、量子化残差情報QDに含まれる各種のシンタックスは、コンテキスト適応型2値算術符号化(CABAC:(Context-based Adaptive Binary Arithmetic Coding))によって符号化されている。なお、以下では、量子化された変換係数Coeffを、単に、変換係数Coeffと呼ぶこともある。
図1は、量子化残差情報復号部111の構成を示すブロック図である。図1に示すように、量子化残差情報復号部111は、変換係数復号部120及び算術符号復号部130を備えている。
(算術符号復号部130)
算術符号復号部130は、量子化残差情報QDに含まれる各ビットをコンテキストを参照して復号するための構成であり、図1に示すように、コンテキスト記録更新部131及びビット復号部132を備えている。
(コンテキスト記録更新部131)
コンテキスト記録更新部131は、各コンテキストインデックスctxIdxによって管理されるコンテキスト変数CVを記録及び更新するための構成である。ここで、コンテキスト変数CVには、(1)発生確率が高い優勢シンボルMPS(most probable symbol)と、(2)その優勢シンボルMPSの発生確率を指定する確率状態インデックスpStateIdxとが含まれている。
コンテキスト記録更新部131は、変換係数復号部120の備える各部から供給されるコンテキストインデックスctxIdx及びビット復号部132によって復号されたBinの値を参照することによってコンテキスト変数CVを更新すると共に、更新されたコンテキスト変数CVを次回更新されるまで記録する。なお、優勢シンボルMPSは0か1である。また、優勢シンボルMPSと確率状態インデックスpStateIdxは、ビット復号部132がBinを1つ復号する毎に更新される。
また、コンテキストインデックスctxIdxは、各周波数成分についてのコンテキストを直接指定するものであってもよいし、処理対象のTU毎に設定されるコンテキストインデックスのオフセットからの増分値であってもよい(以下同様)。
なお、CABACの復号では上記処理の他に、バイパス(Bypass)と呼ばれる復号処理を用いることができる。バイパスの場合には、コンテキスト変数CVを用いず、確率0.5を仮定して復号を行う。この場合、コンテキスト変数CVの備える状態の更新は不要になり、コンテキストのアップデートに伴う遅延を削減することができる。なお、バイパスを使用するか否かは、ctxIdxが負の場合にバイパス、ctxIdxが非負の場合には、ctxIdxに応じてCVを選択する非バイパスとして動作させればよい。なお、バイパスで復号処理された符号を、コンテキストを用いないCABACの算術符号とも呼ぶ。なお、バイパスはEP符号化(等確率、Equal Probability符号化)とも呼ばれることがある。
(ビット復号部132)
ビット復号部132は、コンテキスト記録更新部131に記録されているコンテキスト変数CVを参照し、量子化残差情報QDに含まれる各ビット(Binとも呼ぶ)を復号する。また、復号して得られたBinの値を変換係数復号部120の備える各部に供給する。また、復号して得られたBinの値は、コンテキスト記録更新部131にも供給され、コンテキスト変数CVを更新するために参照される。
なお、通常ビット復号部は、コンテキスト変数CVの状態に応じて1ビット単位で復号処理を行うが、バイパスの場合には、複数ビットを同時に復号することができる。1サイクルで複数ビットを復号可能なバイパスは、スループットを大きく向上させることができる。
(変換係数復号部120)
図1に示すように、変換係数復号部120は、ラスト位置復号部121、スキャン順テーブル格納部122、係数復号制御部123、係数有無フラグ復号部、係数値復号部125、復号係数記憶部126を備えている。
(ラスト位置復号部121)
ラスト位置復号部121は、ビット復号部132より供給される復号ビット(Bin)を解釈し、シンタックスlast_significant_coeff_x及びlast_significant_coeff_yを復号する。復号したシンタックスlast_significant_coeff_x及びlast_significant_coeff_yは、係数復号制御部123に供給される。また、シンタックスlast_significant_coeff_x及びlast_significant_coeff_yの復号に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
(スキャン順テーブル格納部122)
スキャン順テーブル格納部122には、処理対象のTUのサイズ、スキャン方向の種別を表すスキャンインデックス、及びスキャン順に沿って付与された周波数成分識別インデックスを引数として、処理対象の周波数成分の周波数領域における位置を与えるテーブルが格納されている。
このようなスキャン順テーブルの一例としては、図5に示したScanOrderが挙げられる。図5に示したScanOrderにおいて、log2TrafoSize-2は、処理対象のTUのサイズを表しており、scanIdxはスキャンインデックスを表しており、nは、スキャン順に沿って付与された周波数成分識別インデックスを表している。また、図5において、xC及びyCは、処理対象の周波数成分の周波数領域における位置を表している。
(係数復号制御部123)
係数復号制御部123は、量子化残差情報復号部111の備える各部における復号処理の順序を制御するための構成である。係数復号制御部123は、ラスト位置復号部121から供給されるシンタックスlast_significant_coeff_x及びlast_significant_coeff_yを参照し、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、特定した最後の非0変換係数の位置を起点とするスキャン順であって、スキャン順テーブル格納部122に格納されたスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、各周波数成分の位置(uniPosX、uniPosY)を、係数有無フラグ復号部に供給する。
また、係数復号制御部123は、処理対象のTUのサイズ、すなわち、対象周波数領域のサイズを示すパラメータであるszを、変換係数復号部120の備える各部に供給する(図示省略)。ここで、szは、具体的には、処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表すパラメータである。
なお、係数復号制御部123は、スキャン順テーブル格納部122に格納されたスキャン順テーブルよって与えられるスキャン順の順スキャン順に、各周波数成分の位置(uniPosX、uniPosY)を、係数有無フラグ復号部に供給する構成としてもよい。
(係数値復号部125)
係数値復号部125は、ビット復号部132から供給される各Binを解釈し、シンタックスcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、及びcoeff_abs_level_minus3を復号すると共に、これらのシンタックスを復号した結果に基づき、処理対象の周波数成分における変換係数(より具体的には非0変換係数)の値を導出する。また、各種シンタックスの復号に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。導出された変換係数の値は、復号係数記憶部126に格納される。
(復号係数記憶部126)
復号係数記憶部126は、係数値復号部125によって復号された変換係数の各値を記憶しておくための構成である。また、復号係数記憶部126には、係数有無フラグ復号部によって復号されたシンタックスsignificant_coeff_flagの各値が記憶される。復号係数記憶部126によって記憶されている変換係数の各値は、逆量子化・逆変換部13に供給される。
(係数有無フラグ復号部)
本実施形態に係る係数有無フラグ復号部は、周波数領域を、周波数の大きさに応じて1または複数の部分領域に分類し、部分領域毎に定められた導出方法によってコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを用いて非0変換係数の有無を示すシンタックスsignificant_coeff_flagを復号するための構成である。
<係数有無フラグ復号部の第1の構成例>
図1には、本実施形態に係る係数有無フラグ復号部の第1の構成例としての係数有無フラグ復号部124が示されている。
図1に示すように、本構成例に係る係数有無フラグ復号部124は、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、高周波位置コンテキスト導出部124dを備えている。
(周波数分類部124a)
周波数分類部124aは、周波数領域における復号対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、及び高周波位置コンテキスト導出部124dの何れかによって導出されたコンテキストインデックスctxIdxを、当該復号対象の周波数成分に割り付けるための構成である。
本構成例に係る周波数分類部124aは、周波数領域に含まれる各周波数成分の当該周波数領域における位置(uiPosX、uiPosY)を参照し、当該周波数成分を複数の部分領域R0〜R3に分類する。ここで、uiPosX=0、1、...、sz−1であり、uiPosY=0、1、...、sz−1であるとする(szは、上述のように処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表しており、例えば、sz=16,32等である)。
周波数分類部124aは、より具体的には、以下の分類処理を行う。
・uiPosX+uiPosY<2を満たす周波数成分を部分領域R0に分類する。
・2≦uiPosX+uiPosY<TH1を満たす周波数成分を部分領域R1に分類する。
・TH1≦uiPosX+uiPosY<TH2を満たす周波数成分を部分領域R2に分類する。
・TH2≦uiPosX+uiPosYを満たす周波数成分を部分領域R3に分類する。
ここで、TH1及びTH2は、TH1<TH2を満たす閾値を表している。具体的な値としては、例えば、周波数領域のサイズ(処理対象TUのサイズ)に関わらず、TH1=5、TH2=14とすればよい。また、周波数領域のサイズが16×16である場合、TH1=5、TH2=14とし、周波数領域のサイズが32×32である場合、TH1=5、TH2=30としてもよい。このように、周波数領域のサイズに応じて、異なる閾値を用いる構成としてもよい。
図9は、本構成例に係る周波数分類部124aによる分類処理によって、部分領域R0、R1、R2、及びR3に分割された周波数領域の一例を示している。
また、周波数分類部124aは、部分領域R0に属する周波数成分に対して、低周波位置コンテキスト導出部124bによって導出されたコンテキストインデックスを割り付け、部分領域R1及びR2に属する周波数成分に対して、周辺参照コンテキスト導出部124cによって導出されたコンテキストインデックスを割り付け、部分領域R3に属する周波数成分に対して、高周波位置コンテキスト導出部124dによって導出されたコンテキストインデックスを割り付ける。
なお、TH2の値を、sz−2以下とすることは、周辺参照コンテキスト導出部124cにおいて、後述するように、対象周波数成分の周辺の周波数成分が参照可能か否かの判定を省略することができるため好ましい。換言すれば、周辺参照コンテキストの導出に用いる全ての参照画素が処理対象TUの内部に収まるような周波数成分に関しては周辺参照コンテキストを用い、そうでない周波数成分に関しては位置コンテキストを用いることが好ましい。
なお、TH2の値をsz−2とするのが好適であるのは、周辺の周波数成分が対象の位置として2だけ離れた位置の成分も用いる場合である。限定参照カウントの算出方法の説明で後述するように、周辺の周波数成分が対象の位置から1だけ離れた位置の成分を用いる場合にはTH2の値をsz−1とすれば良い。
なお、発明者の実験によると、実施形態1で説明する位置コンテキスト場合には、高い符号化効率を得るためには、TH2の値をsz以上とすることが好ましい。
また、発明者の実験によると、実施形態3で説明する限定参照カウントを利用した周辺参照コンテキストの場合には、TH2の値をsz−2以下とすることが可能であり好ましい。なお、sz−2とする場合には、TH2を、sz−2で求める方法の他、sz×7>>3のように積和で求めることもできる。
なお、閾値の値は、sz毎に定まるテーブルを参照することにより求める構成とすることができる。例えば、サイズの対数log2(sz)の値は、周波数領域のサイズが16×16の場合に4、32×32の場合に5となるが、以下のテーブルtableTH2[]を、サイズの対数の値で参照することにより定数TH2を算出できる。
tableTH2[] = {0, 0, 0, 0, 14, 30}
TH2= table[log2(sz)]
閾値をszサイズから計算で求める場合には、テーブルを削減できることが可能である。例えば、TH2=sz−2のように、サイズと所定の定数との差もしくは和で計算する方法や、TH2=sz×7/8、TH2=sz×7>>3のように、サイズと定数の積および除算、シフトにより求める方法が望ましい。
また、上記の説明においては、周波数分類部124aが、対象周波数成分の位置として(uiPosX、uiPosY)を参照するものとしたが、本実施形態はこれに限定されるものではない。例えば、対象周波数成分の位置として、順スキャン順または逆スキャン順に沿って付与された周波数成分識別インデックス(例えば図5における「n」)を参照し、対象周波数成分を複数の部分領域の何れかに分類する構成としてもよい。
また、周波数分類部124aは、算術符号復号部130でシンタックスsignificant_coeff_flagを復号するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズおよび復号対象の周波数成分毎に算出される。復号されたシンタックスsignificant_coeff_flagは、復号係数記憶部126に格納され、係数値復号部125によって参照される。また、復号の際に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
(低周波位置コンテキスト導出部124b)
低周波位置コンテキスト導出部124bは、復号対象の周波数成分が、低周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出するための構成である。本明細書において、対象周波数成分の位置に基づいて導出された、或いは導出するコンテキストを「位置コンテキスト」とも表現する。位置コンテキストは、ある変換係数の位置の係数有無フラグのコンテキストを、既に復号された係数有無フラグの値によらずに決定されるものであるため、係数有無フラグのコンテキスト導出と、係数有無フラグの復号を並列で行うことができるという効果がある。
本構成例に係る低周波位置コンテキスト導出部124bは、部分領域R0に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+2×uiPosX + uiPosY
なお、NXはコンテキストインデックスの開始点を表す定数である。周波数領域のサイズが4×4及び8×8で用いるコンテキスト数が各々N4個、N8個の場合には、周波数領域のサイズが16×16および32×32の開始点はNX=N4+N8になる。
なお、位置コンテキスト導出部のコンテキストインデックスは固定値であっても構わない。すなわち、位置コンテキストを用いて割り当てられる部分領域に含まれる全ての周波数成分の位置に対して一つのコンテキストを割り当てても良い。例えば、以下の割り当て方を行っても良い。
ctxIdx=NX
なお、固定値(開始点NX)は、色コンポーネントや周波数領域のサイズに応じて選択しても良い。
以降に説明する他の構成においても、コンテキストインデックスを固定値で導出するコンテキスト導出部を含めて、位置コンテキスト導出部と呼ぶ。実際、変換係数の位置に応じて、部分領域の分類を行った上で、ある部分領域においてコンテキストインデックスに固定値を割り当てる方法は、位置に応じてコンテキストを割り当てている、という意味で位置コンテキストと呼べる。
(周辺参照コンテキスト導出部124c)
周辺参照コンテキスト導出部124cは、復号対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について復号済みの非0変換係数の数に基づいて導出するための構成である。本明細書において、対象周波数成分の周辺の周波数成分について復号済みの非0変換係数を参照して導出された、或いは導出するコンテキストを「周辺参照コンテキスト」とも表現する。
本構成例に係る周辺参照コンテキスト導出部124cは、部分領域R1に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+3+min(4、cnt)
ここでは、カウント数cntを固定値(ここでは4)にクリップする処理によって多対一変換処理を行っている。
ここで部分領域R1のコンテキストインデックスの開始点がNX+3であるのは、以下の理由による。部分領域R1の開始点からのオフセット2×uiPosX + uiPosYの値域が0、1、2であることから、NX、NX+1、NX+2が部分領域R1で使用されているため、R1とR0のコンテキストが重ならないように、R1の開始点を定めている。以後、特に断らない限り、部分領域RN+1の開始点は、部分領域RNの開始点と部分領域RNのオフセットの閾値の最大値+1に設定することとする。これにより、2つの部分領域でコンテキストが重ならないようにすることができる。
また、本構成例に係る辺参照コンテキスト導出部124cは、部分領域R2に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+8+min(4、cnt)
ここで、min(A、B)は、A及びBのうち最小のものの値をとる関数である。すなわち、A<Bであれば、min(A、B)=Aである。また、cntは、対象周波数成分の周辺の周波数成分について復号された非0変換係数の数(カウント数)を表している。図10(a)は、処理順序が逆スキャン順である場合の対象周波数成分xと、対象周波数成分xの位置周辺に設定された参照領域RRに含まれる周波数成分である参照周波数成分c1〜c5とを表している。図10(a)に示すように、参照周波数成分の各々について復号された変換係数の値をc1〜c5と表すことにすると、対象周波数成分xについてのcntは、例えば以下の式によって導出することができる。
cnt=(c1!=0)+(c2!=0)+(c3!=0)+(c4!=0)+(c5!=0)
ここで、各項は、()内の引数が真である場合に1をとり、()内の引数が偽である場合に0をとるものとする。
図10(b)は、処理順序が順スキャン順である場合の対象周波数成分xと、対象周波数成分xの位置周辺に設定された参照領域RRに含まれる周波数成分である参照周波数成分c1〜c5とを表している。cntを算出する式は上記と同様である。図10(b)に示すように、順スキャンの場合の参照周波数成分の位置は、逆スキャンの場合の参照周波数成分の各々の位置を、対象周波数成分xに対して、X軸方向およびY軸方向に反転することにより求められる。
また、図10(c)に示すように、参照周波数成分の何れかが周波数領域の外部にはみ出した場合、すなわち、参照領域の一部が対象周波数領域の外側にはみ出した場合、当該外部にはみ出した周波数成分を参照不能であると判定し、当該周波数成分についての変換係数の値は0であるとして取り扱う。すなわち、図10(c)に示す例の場合、c2=0であるとして取り扱う。
(高周波位置コンテキスト導出部124d)
高周波位置コンテキスト導出部124dは、復号対象の周波数成分が、高周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出するための構成である。
本構成例に係る高周波位置コンテキスト導出部124dは、部分領域R3に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+13+min(maxR3、(uiPosX+uiPosY−TH2)>>shift)
ここで、記号「>>」は、右ビットシフトを表している。また、shift及びmaxR3としては、例えば、shift=4、maxR3=3を用いればよいが本実施形態はこれに限定されるものではない。
また、本構成例に係る低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、及び高周波位置コンテキスト導出部124dは、対象周波数領域のサイズが16×16及び32×32の何れであっても、共通の式を用いてコンテキストインデックスctxIdxを導出する構成としてもよいし、対象周波数領域のサイズが16×16であるのか32×32であるのかに応じて、異なる式を用いてコンテキストインデックスctxIdxを導出する構成としてもよい。このような構成の一例としては、高周波位置コンテキスト導出部124dが、
対象周波数領域のサイズが16×16である場合:
ctxIdx=NX+13+min(maxR3、(uiPosX+uiPosY−TH2)>>shift)
を用い、
対象周波数領域のサイズが32×32である場合:
ctxIdx=NX+13+maxR3+1+min(maxR3、(uiPosX+uiPosY−TH2)>>shift)
を用いる構成が挙げられる。
また、他の例としては、高周波位置コンテキスト導出部124dが、
対象周波数領域のサイズが16×16である場合:
ctxIdx=NX+13+min(3、(uiPosX+uiPosY−14)>>4)
を用い、
対象周波数領域のサイズが32×32である場合:、
ctxIdx=NX+13+min(3、(uiPosX+uiPosY−30)>>4)
を用いる構成が挙げられる。
更に他の例としては、高周波位置コンテキスト導出部124dが、
対象周波数領域のサイズが16×16である場合:
ctxIdx=NX+13+min(3、(uiPosX+uiPosY−TH2)>>3)
を用い、
対象周波数領域のサイズが32×32である場合:
ctxIdx=NX+13+min(3、(uiPosX+uiPosY−TH2)>>4)
を用いる構成が挙げられる。
更に他の例としては、高周波位置コンテキスト導出部124dが、
対象周波数領域のサイズが16×16である場合:
ctxIdx=NX+13+min(R3maz、(uiPosX+uiPosY−TH2)>>3)
を用い、
対象周波数領域のサイズが32×32である場合:
ctxIdx=NX+13+R3max+1+min(R3max、(uiPosX+uiPosY−TH2)>>4)
を用いる構成が挙げられる。
また、低周波位置コンテキスト導出部124b、及び高周波位置コンテキスト導出部124dが、周波数領域のサイズ毎に異なる式を用いてコンテキストインデックスctxIdxを導出する構成とし、周辺参照コンテキスト導出部124cが、異なるサイズの周波数領域に対して共通の式を用いてコンテキストインデックスctxIdxを導出する構成としてもよい。
なお、本構成例に係る周波数分類部124aによる分類処理によって、分割される周波数領域の例は、図9に示すものに限定されるものではなく、例えば、図11(a)及び(b)に示すように周波数領域を分割してもよい。
なお、位置コンテキスト導出部のコンテキストインデックスは固定値であっても構わない。すなわち、位置コンテキストを用いて割り当てられる部分領域の全ての周波数上の位置に対して一つのコンテキストを割り当てても良い。例えば、以下の割り当て方についても位置コンテキスト導出部と呼ぶ。
ctxIdx=NX
なお、固定値(開始点NX)は、色コンポーネントや周波数領域のサイズに応じて選択しても良い。
図11(a)に示す例においては、周波数領域は、部分領域R0、R1、及びR3に分類される。部分領域R0、R1、及びR3に属する周波数成分に対しては、上述したように、それぞれ、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c及び高周波位置コンテキスト導出部124dによってコンテキストインデックスctxIdxが算出される。
また、図11(b)に示す例においては、周波数領域は、部分領域R1及びR3に分類される。部分領域R1及びR3に属する周波数成分に対して、上述したように、それぞれ、周辺参照コンテキスト導出部124c及び高周波位置コンテキスト導出部124dによってコンテキストインデックスctxIdxが算出される。
以上のように、本構成例に係る係数有無フラグ復号部によれば、対象周波数領域における上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出するので、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
<係数有無フラグ復号部の第2の構成例>
本実施形態に係る係数有無フラグ復号部の第2の構成例について、図12、13を参照して説明する。図12は、本構成例に係る係数有無フラグ復号部124−1の構成を示すブロック図である。また、図13は、非0変換係数カウント部124fが非0変換係数の数をカウントするスキャン列を説明するための図である。
図12に示すように、本構成例に係る係数有無フラグ復号部124−1は、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、前スキャン列コンテキスト導出部124eを備え、さらに前スキャン列コンテキスト導出部124eには非0変換係数カウント部124fが備えられている。なお、上記第1の構成例で示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本構成例において、上記第1の構成例と異なるのは、部分領域R3に属する周波数成分に対するコンテキストインデックスctxIdxの導出方法である。
したがって、本構成例においても、部分領域R0に属する周波数成分に対しては、上記第1の構成例と同様に、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+2×uiPosX + uiPosY
また、部分領域R1に属する周波数成分に対しては、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+3+min(4、cnt)
また、部分領域R2に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+8+min(4、cnt)
一方、部分領域R3に属する周波数成分に対しては、前スキャン列コンテキスト導出部124eが以下の方法により、コンテキストインデックスctxIdxを導出する。
(前スキャン列コンテキスト導出部124e)
前スキャン列コンテキスト導出部124eは、復号対象の周波数成分が、高周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、スキャン順で1つ前のスキャン列に含まれる非0変換係数の数に基づいて導出するための構成である。
また前スキャン列コンテキスト導出部124eに含まれる非0変換係数カウント部124fは、1つ前のスキャン列において出現した非0変換係数の数を計数する構成である。
本構成例に係る前スキャン列コンテキスト導出部124eは、部分領域R3に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+13+min(maxR3、last_cnt×linetbl[uiPosX+uiPosY]>>shift)
ここで、last_cntは、1つ前のスキャン列において出現した非0変換係数の数を示している。また、linetblは、スキャン列によって存在する非0変換係数の数が異なることから、非0変換係数の数を正規化するための係数テーブルであり、以下の式により生成される。
linetbl(x)=2shift1/(x+1) (x<sz)
linetbl(x)=2shift1/(2×sz−x−1) (x≧sz)
また、shift=shift1+2であり、例えば、shift1=3である(以下同様)。
また、本構成例に係る非0変換係数カウント部124fは、スキャン順が逆スキャンの場合であって、対象周波数成分が属するスキャン列Lx(図13(a))を処理する場合に、前のスキャン列Lx+1で発生した非0変換係数の数last_cntをカウントする。なお、順スキャンの場合は、Lx−1のラインで発生した非0変換係数の数をカウントすることになる。
また、前スキャン列コンテキスト導出部124eは、1つ前のスキャン列において出現した非0変換係数の数ではなく、1つ前のスキャン列以前において出現した非0変換係数の数を用いる構成であってもよい。例えば、last_cntを、現スキャン列の非0変換係数の数curr_cntに、1つ前のスキャン列において用いたlast_cnt´に重みをかけた値last_cnt´>>1を加えて求める構成であってもよい。具体的な式としては、
last_cnt=(last_cnt´>>1)+curr_cnt
となる。
また、前スキャン列コンテキスト導出部124eは、周波数成分の位置に応じて、異なる方法によりコンテキストインデックスctxIdxを導出する構成であってもよい。
例えば、周波数成分の位置が、uiPosX>uiPosYを満たす場合は、下記の式によってコンテキストインデックスctxIdxを導出する。
CtxIdx=13+min(maxR3,last_cntx×linetbl[uiPosX+uiPosY]>>shift)
一方、周波数成分の位置が、uiPosX≦uiPosYを満たす場合は、下記の式によりコンテキストインデックスctxIdxを導出する。
CtxIdx=NX+13+maxR3+1+min(maxR3,last_cnty×linetbl[uiPosX+uiPosY]>>shift)
ここで、last_cntxは、uiPosX>uiPosYを満たす、1つ前のスキャン列で出現した非0変換係数の数であり、last_cntyは、uiPosX≦uiPosYと満たす、1つ前のスキャン列で出現した非0変換係数の数である。すなわち、1つ前のスキャン列のうち、中央より右上方向のスキャン列がlast_cntxのカウントの対象となり、中央より左下方向のスキャン列がlast_cntyのカウントの対象となる(図13(b))。
また、shift=shift1+1である。
さらに、前スキャン列コンテキスト導出部124eは、以下の式によりコンテキストインデックスctxIdxを導出する構成であってもよい。
CtxIdx=13+min(maxR3,last_cnt>>shifttbl[uiPosX+uiPosY+1])
ここで、
shifttbl[k]=Int(log2(numLineCoeff[k]/maxR3))
であり、numLineCoeff[k]はkの位置のスキャン列における非0変換係数の数である。また、Intは、引数の小数点以下を切り捨てることを示している。
以上のように、本構成例に係る係数有無フラグ復号部によれば、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数に基づいて導出する。ここで、前スキャン列に沿った非0変換係数の数は、一度カウントしておけば、現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを導出する際に共通に用いることができる。したがって、位置の異なる変換係数有無フラグに対して個別にコンテキストインデックスを導出する必要のある従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができると共に、高い符号化効率を実現することができる。
<係数有無フラグ復号部の第3の構成例>
本実施形態に係る係数有無フラグ復号部の第3の構成例について、図14、15を参照して説明する。図14は、本構成例に係る係数有無フラグ復号部124−2の構成を示すブロック図である。また、図15(a)〜(i)は、周辺参照コンテキスト導出部124gがコンテキストを導出するときに参照する周波数成分を示す図である。なお、図10(a)と図10(b)の関係において既に示したように、図15(a)〜(i)の場合においても、対応する順スキャンの場合の参照周波数成分の位置は、逆スキャンの場合の参照周波数成分の各々の位置を、対象周波数成分xに対して、X軸方向およびY軸方向に反転することで求められる。そのため、本発明は、significant_coeff_flagを順スキャンで行う場合にも適用することができる。
図14に示すように、本構成例に係る係数有無フラグ復号部124−2は、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124gを備えている。なお、上記第1の構成例で示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本構成例において、上記第1の構成例と異なるのは、部分領域R3に属する周波数成分に対するコンテキストインデックスctxIdxの導出方法である。
したがって、本構成例においても、部分領域R0に属する周波数成分に対しては、上記第1の構成例と同様に、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+2×uiPosX + uiPosY
また、部分領域R1に属する周波数成分に対しては、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+3+min(4、cnt)
また、部分領域R2に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+8+min(4、cnt)
一方、部分領域R3に属する周波数成分に対しては、周辺参照コンテキスト導出部124gが以下の方法により、コンテキストインデックスctxIdxを導出する。
(周辺参照コンテキスト導出部124g)
周辺参照コンテキスト導出部124gは、復号対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について復号済みの非0変換係数の数に基づいて導出するための構成である。
周辺参照コンテキスト導出部124gは、低周波数の領域R1、R2で用いるcntよりも参照数の少ないcnt2(限定参照カウント)を用いて、部分領域R3に属する周波数成分に対して、以下の式によりコンテキストインデックスctxIdxを導出する。なお限定参照カウントとは、他の部分領域でも用いられるカウントよりも参照領域が小さく限定されていることを意味する。それに対して5点参照など通常のカウントcntの計算を通常参照カウントと呼ぶ。
CtxIdx=NX+8+cnt2
また、cnt2は、以下の式により算出する。
cnt2=(c1!=0)+(c3!=0)+(c4!=0)
ここで、c1、c3、c4は、図15の(i)に示す、対象周波数成分xの周辺の周波数成分について復号された変換係数である。
なお、限定参照カウントcnt2の参照位置は上記によらず、5点よりも参照数が少ない別の参照位置を用いても良い。例えば、参照数が2の場合の一例は、
cnt2=(c1!=0)+(c3!=0)
になる。
さらに、対象周波数領域のサイズが16×16の場合は、周辺参照コンテキスト導出部124gは、
CtxIdx=NX+8+cnt2
を用いてコンテキストインデックスctxIdxを導出し、対象周波数領域のサイズが32×32の場合は、
CtxIdx=NX+8+cnt2
を用いて、コンテキストインデックスctxIdxを導出する。
このように、低周波側に位置する領域の参照数よりも、高周波数側に位置する領域の参照数の方が少ないカウント数を用い、カウント数を領域毎に定まる開始点に加算して、コンテキストインデックスを求めることが好ましい。
上記の例において、部分領域R3のコンテキストの開始点はNX+8であり、部分領域R2のコンテキストの開始点と等しい。これはカウント数cntとcnt2が同じ値の場合には部分領域R2と部分領域R3とで同じコンテキストインデックスCtxIdxとなることを意味する。換言すれば、部分領域R2と部分領域R3は同じコンテキストを共有する。このように、異なる周波数領域に位置する領域間で同じコンテキストを共有する場合、先にスキャンする領域(significant_coeff_flagの符号化順が逆スキャンであればR3)で得られたコンテキストを、次にスキャンする領域(significant_coeff_flagの符号化順が逆スキャンであればR2)で利用することができるため高い符号化効率を実現できる。また、部分領域に分割した場合においても、コンテスト数を増加させることないため、コンテキストに伴うメモリを低減することができる。
図16は、対象周波数領域を構成する部分領域R0〜R3のうち、部分領域R2とR3とで一部のコンテキストを共有する場合を示している。より具体的には、部分領域R2で用いられる通常参照カウントと、部分領域R3で用いられる限定参照カウントとで同じコンテキストインデックス(ここではNX+8〜NX+11)で示されるコンテキストを共有することを示している。
発明者の実験では、カウント数の小さい領域(部分領域R2)とカウント数の大きい領域(部分領域R3)で同一の開始点を用い、2つの領域でコンテキストを共有する方が、コンテキストを共有しない場合に比べて高い符号化効率を実現可能であることを確認している。なお、これら2つの領域でコンテキストを共有しない方法も実現可能である。この場合、部分領域R3において、
CtxIdx=NX+13+cnt2
とする。
以上のように、本構成例に係る周辺参照コンテキスト導出部124gは、部分領域毎に定まる所定の開始点(例えば、上記NX)と、上記部分領域毎に定まる変数(例えば上記cnt2)とを加算することによってコンテキストインデックスを導出するものであり、上記変数の導出方法の異なる複数の部分領域について、開始点を同じ値に設定することにより、コンデキストインデックスの導出方法の異なる当該複数の部分領域において、共通のコンテキストを用いるものである。
(係数有無フラグ復号部の第3の構成例の他の構成例)
以下では、係数有無フラグ復号部124−2による他の処理例について図48〜図50を参照して説明する。
図48(a)〜(b)は、本処理例において、周波数分類部124aによって分割された部分領域を示す図であり、図48(a)は、輝度値に関する変換係数を復号する際に好適に適用されるものであり、図48(b)は、色差に関する変換係数を復号する際に好適に適用されるものである。図48(a)〜(b)において、閾値TH、閾値TH2は、以下の式により、対象周波数領域の幅と高さの最大値に応じて
TH=Max(width、height)>>2
TH2=3×Max(width、height)>>4
によって定められる。ここで、widthは、周波数成分を単位として表現された対象周波数領域の幅を示しており、heightは周波数成分を単位として表現された対象周波数領域の高さを示している。例えば16×4変換と呼ばれる対象周波数領域の幅が16成分(16画素に対応)、高さが4成分(4画素に対応)であるとき、width=16、height=4である。
周波数分類部124aは、図49に示すように、対象変換係数の周波数成分上の位置(xC、yC)に応じて、以下の式のように、X座標とY座標の和と閾値THの比較を用いて、部分領域R1と部分領域R2を分類する。
xC+yC < TH (or xC+yC >= TH)
また、周波数分類部124aは、図49に示すように、対象変換係数の周波数成分上の位置(xC、yC)をあるサブブロックサイズ(ここでは4)で割った値(サブブロック座標)に応じて、以下の式のように、サブブロック座標でのX座標とY座標の和と閾値TH2の比較を用いて、互いに参照数の異なる部分領域R2と部分領域R3を分類する。
(xC>>2)+(yC>>2) < TH2
ここで2つの部分領域を区別する閾値TH2は、TH2×サブブロックサイズ(=4)が、対象周波数領域のサイズsz(=Max(width、height))よりも小さいことを満たすことが好ましい。この場合、対象周波数成分の周辺の周波数成分が参照可能か否かの判定を省略することができる。例えば、
3×Max(width、height)>>4
はMax(width、height)×3/4であるため、この上記関係を満たす。
また、TH2の値は、処理量削減と符号化効率削減のバランス上、Max(width、height)>>2(>>2はサブブロックサイズが4である場合に、サブブロックで割る処理)以下であることが好ましい。
すなわち、上記対象周波数領域のサイズをszと表すとき、処理量削減と符号化効率削減のバランス上は、上記閾値THおよびTH2は、判定にX座標及びY座標の和を用いる場合にはsz以下の値、サブブロックのX座標及びY座標の和を用いる場合には、sz/サブブロック以下の大きさを有することが好ましい。上記TH、TH2はこの関係を満たす。
さらに、上記対象周波数領域のサイズをszと表すとき、周辺の周波数成分が参照可能か否かの判定を省略するためには、上記閾値THおよびTH2は、判定にX座標及びY座標の和を用いる場合にはsz未満の値、サブブロックのX座標及びY座標の和を用いる場合には、sz/サブブロック未満の大きさを有することが好ましい。上記TH、TH2はこの関係を満たす。
また、閾値は、対象周波数領域の大きさに応じて定めても良い。例えば、以下の式のように、対象周波数領域の幅と高さの最大値を右シフトした値、及び、右シフト後に所定の値を加算または減算した値を用いても良い
TH2=3×Max(width、height)>>4
TH2=(3×Max(width、height)>>4)+4
図49は、図48(a)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスであって、輝度に関するコンテキストインデックスcxtIdxを導出する導出処理を示す擬似コードである。図49において、領域R0のコンテキスト導出は、位置コンテキスト導出部124bによって行われ、領域R1〜領域R3のコンテキスト導出は、周辺参照コンテキスト導出部124gによって行われる。
周辺参照コンテキスト導出部124gは、例えば、部分領域R1に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtxを周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR1 + Min(2, ctxCnt);
このように、コンテキストインデックスsigCtxは、開始点sigCtxOffsetR1とオフセット値ctxCntの和により求められる。ここで、本構成のオフセット値ctxCntは、カウント数に応じて得られる値であり、ここでは、カウント数を約1/2にするように右シフトして得られる値であり
ctxCnt=(cnt+1)>>1 ・・・(eq.A4)
によって定まる。
なお、多対一変換する処理は、右シフトよらず、以下のようにカウント数を固定値(ここでは3)にクリップする処理でも良い。
ctxCnt=min(3、cnt)
この場合には、コンテキストインデックスを以下で算出する。
sigCtx = sigCtxOffsetR1 + ctxCnt;
なお、非0変換係数のカウント数cntを算出する際には、対象変換係数の周波数成分上の位置(xC、yC)に応じて参照する変換係数を変更しても良い。例えば、図49に示す擬似コードでは、位置に応じて、c1、c2、c3、c4、c5の5つを参照するか、もしくは、c1、c2、c4、c5の4つを参照するかを切り替える。
if( ( ( xC & 3 ) || ( yC & 3 ) ) && ( ( (xC+1) & 3 ) || ( (yC+2) & 3 ) )))
{
cnt = (c1!=0) + (c2!=0) + (c4!=0) + (c5!=0);
} else{
cnt= (c1!=0) + (c2!=0) + (c3!=0) + (c4!=0) + (c5!=0);
}
また、周辺参照コンテキスト導出部124gは、例えば、部分領域R2に属する周波数成分に対しては、部分領域R1とは異なる開始点(ここではsigCtxOffsetR2)を用いて以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtxを周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR2 + Min(2, ctxCnt);
なお、オフセット値ctxCntの計算方法は、部分領域R1と同様である。また、上記では、2以下にクリップする処理を加えているが、これも多対一変換処理と言える。
また、周辺参照コンテキスト導出部124gは、例えば、高周波成分である部分領域R3に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtx を周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR2 + Min(2, ctxCnt);
部分領域R3の開始点は、部分領域R2と同じくsigCtxOffsetR2を用いる。これにより既に説明したようにコンテキスト共有により高い符号化効率と、少ないコンテキスト数を同時に実現することができる。
ここで、オフセット数ctxCntの計算には、以下の式を用いる。
cnt = (c1!=0) + (c5!=0);
ctxCnt = cnt;
このように高周波成分の部分領域R3では、低周波数成分の部分領域R1、R2よりも少ない参照数によりカウント数cntを算出するため処理量が削減される。
上記式では、カウント数cntの計算は、図51(a)に示すc1、c5の2点を用いて算出している。この場合、処理順で直前(処理順が逆スキャン順である場合には、対象とする変換係数の位置の下側)に位置する座標(例えば図10(a)に示すc3)の変換係数を参照しないため、コンテキスト導出処理と復号処理とを並列に処理が可能になる。
また、さらに並列度を高める場合には、処理順で直前だけでなく直前の直前に位置する座標(例えば図10(a)に示すc1)の変換係数をさらに参照しない方法が望ましい。この場合、以下の式のように、図51(b)に示すc2、c5の2点を用いてカウント値を算出しても良い。
cnt = (c2!=0) + (c5!=0);
ここで、参照数の異なる部分領域R2及び部分領域R3において、参照数が多い方の部分領域(R2)では、右シフト等によりカウント数を多対一変換する処理(集約処理とも呼ぶ)を行ってオフセット値ctxCntを求めてコンテキストインデックスを算出するが、参照数が少ない方の部分領域(R3)では、カウント数を減らす処理を行わずにそのままコンテキストインデックスを算出する。部分領域R3では、部分領域R2に比べカウント数の集約処理を削除することができるため処理量が削減される。なお、2つの部分領域の処理上のデザイン統一を優先して、2つの部分領域で同様に集約処理を行う(部分領域R3で右シフトなどを行う)ことも構わない。なお、カウント数の多対一変換処理は、カウント数の値域を圧縮する処理であると捉えることもできる。
色差の場合も、図48(b)の部分領域R0、部分領域R1、部分領域R3について、輝度の場合と同様の処理を行う。まず、周波数分類部124aは、図50に示すように、対象変換係数の周波数成分上の位置(xC、yC)をあるサブブロックサイズ(ここでは4)で割って得られるサブブロック座標のX座標とY座標の和と、周波数領域の幅と高さの和から計算される閾値TH2との比較により、互いに参照数の異なる部分領域R1と部分領域R3を分類する。さらに、図50に示す通り、部分領域R0では位置コンテキスト導出部124bにおいて位置コンテキストによりコンテキスト導出を行い、部分領域R1、R3では周辺参照コンテキスト導出部124gにおいて、周辺参照コンテキストによるコンテキスト導出を行う。部分領域R1と部分領域R3では、異なる参照数を用いながら、コンテキストを共有する。また、参照数の多い部分領域R1ではカウント数の集約処理を行い、参照数の少ない部分領域R2ではカウント数の集約処理を行わなずにコンテキストインデックスを導出する。
上記の例では、高周波領域において少ないカウント数を用いるため、低周波領域における多いカウント数を用いる場合と比べて処理量を削減できる。また、少ないカウント数を用いる部分領域では、コンテキストインデックスの導出においてカウント数を右シフトもしくはクリップするなどの多対一変換処理が不要になる。そのためさらに処理量が削減される。
上記の構成によれば、導出方法が異なる複数の部分領域において、部分領域毎に定まる開始点を等しくすることにより、コンテキスト数を増加させることがなく、また、高い符号化効率を実現したまま処理量の削減が可能である。
なお、周辺参照コンテキスト導出部124gは、以下に示すように偏りに応じて参照する変換係数の以下を切り替えても良い。
より具体的には、本構成例に係る周辺参照コンテキスト導出部124gは、部分領域R3に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する構成としてもよい。
ctxIdx=NX+13+min(3、pref_y_flag? cnty:cntx)
ここで、pref_y_flagは、変換係数の偏りを考慮して導出される垂直優先フラグpref_y_flagであり、この垂直優先フラグによりcntyとcntxのいずれを参照するかを決定する。なお、垂直優先フラグは、以下の3つの方法により、判定することができる。
・対象位置による判定
uiPosY>uiPosXのときtrueとする。すなわち、
pref_y_flag=uiPosY>uiPosX ? true:false
とする。
・スキャン順で非0変換係数のラストの位置による判定
last_significant_coeff_x<last_significant_coeff_yのときtrueとする。すなわち、
pref_y_flag=last_significant_coeff_x<last_significant_coeff_y ? true:false
とする。
・1つ前のスキャン列による判定
last_cntx<last_cntyのときtrueとする。すなわち、
pref_y_flag=last_cntx<last_cnty ? true:false
とする。
なお、垂直優先フラグの判定は、上記3つの方法に限られるものではない。
また、垂直優先フラグを用いる場合においても、通常参照カウントと限定参照カウントで同じコンテキストを共有することも可能である。この場合、次のように部分領域R3のコンテキストの開始点を部分領域R2の開始点と同じNX+8とすることで実現できる。
ctxIdx=NX+8+min(3、pref_y_flag? cnty:cntx)
また、cnty及びcntxは、対象周波数成分の周辺の周波数成分のうち、参照対象となった周波数成分について復号された非0変換係数の数を表している。cnty及びcntxを導出するために参照される周波数成分の数は2〜4であり、上述したcntの参照数5よりも少ない。なお、以下では、cnty及びcntxを優先参照カウントとも呼称する。
次に、cnty及びcntxの算出方法について、図15を参照して説明する。図15には、処理順序が順スキャン順である場合の対象周波数成分xと、その周辺の参照周波数成分について復号された変換係数(c1〜c5)を示している。
まず、参照数が4の場合を、図15の(a)、(b)に示す。参照数が4の場合は、図15の(a)に示すc1、c3、c4、c5、図15の(b)に示すc1、c2、c3、c4を参照し、下記の式によりcnty及びcntxを算出する。
cnty=(c1!=0)+(c3!=0)+(c4!=0)+(c5!=0)
cntx=(c1!=0)+(c2!=0)+(c3!=0)+(c4!=0)
ここで、各項は、()内の引数が真である場合に1をとり、()内の引数が偽である場合に0をとるものとする。以下、同様である。
また、参照数が3の場合は、図15の(c)に示すc1、c3、c5、図15の(d)に示すc1、c2、c3を参照し、以下の式によりcnty及びcntxを算出する。
cnty=(c1!=0)+(c3!=0)+(c5!=0)
cntx=(c1!=0)+(c2!=0)+(c3!=0)
なお、参照数が3の場合は、図15の(e)に示すc3、c4、c5、図15の(f)に示すc1、c2、c4を参照し、以下の式によりcnty及びcntxを算出してもよい。
cnty=(c3!=0)+(c4!=0)+(c5!=0)
cntx=(c1!=0)+(c2!=0)+(c4!=0)
また、参照数が2の場合は、図15の(g)に示すc3、c5、図15の(h)に示すc1、c2を参照し、以下の式によりcnty及びcntxを算出してもよい。
cnty=(c3!=0)+(c5!=0)
cntx=(c1!=0)+(c2!=0)
以上のように、本構成例に係る係数有無フラグ復号部によれば、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出し、上記複数の部分領域のうち高周波数側の部分領域において設定される上記参照領域は、低周波数側の部分領域において設定される上記参照領域よりも小さいので、低周波数側の部分領域において設定される参照領域と高周波数側の部分領域において設定される参照領域とが同じ大きさを有する従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができると共に、高い符号化効率を実現することができる。
<係数有無フラグ復号部の第4の構成例>
本実施形態に係る係数有無フラグ復号部の第4の構成例について、図17を参照して説明する。本構成例は、第1の構成例と第3の構成例をあわせた構成である。なお、上記第1〜第3の構成例で示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
図17は、本構成例に係る係数有無フラグ復号部の構成を示すブロック図である。図17に示すように、本構成例に係る係数有無フラグ復号部124’は、周波数分類部124a´、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124g、および高周波位置コンテキスト導出部124dを備えている。
本構成例において、上記第3の構成例と異なるのは、部分領域R4を新設し、R4に属する周波数成分に対するコンテキストインデックスctxIdxの導出方法を、第1の構成例で示した位置コンテキストとすることである。
したがって、本構成例においても、部分領域R0に属する周波数成分に対しては、上記第1の構成例と同様に、低周波位置コンテキスト導出部124bが、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+2×uiPosX + uiPosY
また、部分領域R1に属する周波数成分に対しては、周辺参照コンテキスト導出部124gが、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+3+min(4、cnt)
また、部分領域R2に属する周波数成分に対して、周辺参照コンテキスト導出部124gが、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+8+min(4、cnt)
また、周辺参照コンテキスト導出部124gは、部分領域R3に属する周波数成分に対して、低周波数の領域R1、R2で用いるcntよりも参照数の少ないcnt2(限定参照カウント)を用いて、以下の式によりコンテキストインデックスctxIdxを導出する。なお、本例においても、cnt2のことを限定参照カウントとも呼称する。
CtxIdx=NX+8+cnt2
本構成例に係る高周波位置コンテキスト導出部124dは、部分領域R4に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+13
上記の例では、部分領域R4のコンテキスト数は1つであるため、部分領域R4であると判定された場合に、さらにコンテキストインデックスctxIdxを導出する処理は不要である。発明者の実験では、コンテキスト数を1つとした場合にも閾値TH4を適切に定めることにより高い符号化効率を実現したまま処理量の削減が可能であることを確認している。
上記の例では、部分領域R4のコンテキスト数が1つであるため、高周波位置コンテキスト導出部124dにおいて、固定値を用いてコンテキストインデックスを導出している。
図18は、対象周波数領域を構成する部分領域R0〜R4のうち、部分領域R2とR3とで一部のコンテキストを共有する場合を示している。より具体的には、部分領域R2で用いられる通常参照カウントと、部分領域R3で用いられる限定参照カウントとで同じコンテキストインデックス(ここではNX+8〜NX+11)で示されるコンテキストを共有することを示している。図18では部分領域R4に用いるコンテキスト数を1としているが、以下のようにコンテキスト数を2つとする構成も可能である。例えば、周波数領域のサイズにより2つを区別する構成
ctxIdx=(sz==16)? NX+13:NX+14
や、X座標とY座標の比較により2つを区別する構成
ctxIdx=(uiPosY>uiPosX)? NX+13:NX+14
などが可能である。
なお、第1の構成例と同じく一般に以下の形式でコンテキストを導出することも可能である。
ctxIdx=NX+13+min(maxR3、(uiPosX+uiPosY−TH2)>>shift)
また、図18に示すように、本実施形態で用いる周波数分類部124a´は、5つの部分領域R0〜R4に分類する。より具体的には、以下の分類処理を行う。
・uiPosX+uiPosY<2を満たす周波数成分を部分領域R0に分類する。
・2≦uiPosX+uiPosY<TH1を満たす周波数成分を部分領域R1に分類する。
・TH1≦uiPosX+uiPosY<TH2を満たす周波数成分を部分領域R2に分類する。
・TH2≦uiPosX+uiPosY<TH3を満たす周波数成分を部分領域R3に分類する。
・TH3≦uiPosX+uiPosYを満たす周波数成分を部分領域R4に分類する。
また、上記のTH1は例えば5とする。また、TH2とTH3は、以下の式によりszに基づいて定めることができる。
TH2 = sz×7>>3
TH3 = sz+6
この周波数領域のサイズが16×16の場合にはTH2=14、TH3=22、32×32の場合にはTH2=28、TH3=38である。
また、低QPにおける性能低下を軽減するために、閾値TH2、及びTH3を次のように設定してもよい。
TH2 = sz
TH3 = sz+8
つまり、周波数領域のサイズが16×16の場合にはTH2=16、TH3=24とし、周波数領域のサイズが32×32の場合にはTH2=32、TH3=40と設定してもよい。
なお、閾値の算出の一般式は、
TH2 = sz×a2/b2+c2
TH3 = sz×a3/b3+c3
である。ここで、a2、b2、c2、a3、b3、c3は所定の定数である。b2およびb3での除算はシフト演算で処理が可能である。一般に閾値を大きくする方が符号化効率は高くなるが、処理量が削減される高周波数側の部分空間R3、部分空間R4の面積が小さくなるため処理量削減の効果は減少する。
なお、閾値の計算に用いる定数がサイズszによる場合はテーブルを参照して計算することによりサイズによる分岐を省略できる。また、定数がサイズに寄らない場合にはテーブルを参照する処理を省略できる。定数がサイズによらない場合は、以下のように求めればよい。
TH2 = sz×a/b+c
TH3 = sz×a/b+c
閾値は比率a/bもしくは加算cで制御できる。閾値をa/bで制御する場合には、高周波数側の部分空間の面積と、低周波数側の部分空間の面積比は、サイズszによらないが、加算cで制御する場合にはサイズによる。発明者の実験では、32×32では16×16に比べ部分領域R4の面積比が大きくなっても良いことから、TH3の算出では加算cを用いることが適当である。このような例は、既に説明した式以外に、以下の式も適当である。
TH2 = sz×7>>3
TH3 = sz+12
なお、発明者の実験によると、大きな処理量低減を得るためには、TH2はsz−2以下とすることが良く、高い符号化効率を実現するにはTH3はsz以上とすることが良い。例えば、以上の式以外に、以下の式が適当である。また、TH2=sz−1とする場合にも、部分領域R1において対象周波数成分の周辺の周波数成分が参照可能か否かの判定を省略することができる。このため、処理量低減効果は若干低減するものの、保守的にするならばTH2=sz−1としても良い。
TH2 = sz×7>>3
TH3 = sz×11>>3
以上のように、本構成例に係る係数有無フラグ復号部によれば、所定の閾値TH2より高周波数側の部分領域では、各変換係数有無フラグに割り付けるコンテキストインデックスの取り得る値の範囲が、低周波数側の部分領域において設定される上記参照領域において取り得る値の範囲よりも小さいため、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。さらに別の閾値TH3より高周波数側の部分領域においては、コンテキストインデックスを位置に基づいて導出するので、さらに処理量を削減することができる。
また、以上の構成の一形態では、カウント数の導出方法が異なる2つの部分領域において、部分領域毎に定まる開始点を等しくすることにより、コンテキスト数を増加させることがなく、また、高い符号化効率を実現したまま処理量の削減が可能である。
また、以上の構成の一形態では、位置に基づいて導出する場合のコンテキスト数を1つ、もしくは、2つと少ない値としている。これにより、コンテキスト数の増加を最小限に抑え、さらにコンテキストを区別する処理量が少なく、高い符号化効率を実現したまま処理量の削減が可能である。
以上のように、本構成例に係る係数有無フラグ復号部において、周波数分類部124a´は、対象周波数領域を、処理対象の変換係数有無フラグの位置に応じて、少なくとも3つの部分領域に分類するものであり、周辺参照コンテキスト導出部124gは、第1の部分領域(部分領域R1またはR2)では、復号済みの非0変換係数をN1個(N1は自然数)参照し、第2の部分領域(部分領域R3)では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、第3の部分領域(部分領域R4)では、高周波位置コンテキスト導出部124dが、変換係数有無フラグの位置に応じて、コンテキストインデックスを導出する。
上記の構成によれば、コンテキストインデックスを参照するために参照する復号済みの非0変換係数の数がより小さく設定された部分領域と、対象周波数領域における該変換係数有無フラグの位置に基づいてコンテキストインデックスを導出する部分領域とを組み合わせることによって、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
<係数有無フラグ復号部の第5の構成例>
本実施形態に係る係数有無フラグ復号部の第5の構成例について、図19〜図21を参照して説明する。図19は、本構成例に係る係数有無フラグ復号部124−3の構成を示すブロック図である。また、図20は、非0変換係数の数をカウントするスキャン列を説明するための図である。また、図21(a)〜(c)は、コンテキストを導出するときに産参照する対象を説明するための図である。
図19に示すように、本構成例に係る係数有無フラグ復号部124−3は、周波数分類部124a、低周波位置コンテキスト導出部124b、高周波領域コンテキスト導出部124hを備え、さらに、高周波領域コンテキスト導出部124hには、周辺参照コンテキスト導出部124iおよび前スキャン列コンテキスト導出部124eが備えられている。また、前スキャン列コンテキスト導出部124eには、非0変換係数カウント部124fが備えられている。なお、上記第1〜第3の構成例で示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本構成例において、上記第1の構成例と異なるのは、部分領域R3に属する周波数成分に対するコンテキストインデックスctxIdxの導出方法である。
したがって、本構成例においても、部分領域R0に属する周波数成分に対しては、上記第1の構成例と同様に、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+2×uiPosX + uiPosY
また、部分領域R1に属する周波数成分に対しては、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+3+min(4、cnt)
また、部分領域R2に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+8+min(4、cnt)
一方、部分領域R3に属する周波数成分に対しては、高周波領域コンテキスト導出部124hが以下の方法により、コンテキストインデックスctxIdxを導出する。
(高周波領域コンテキスト導出部124h)
高周波領域コンテキスト導出部124hは、復号対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について復号済みの非0変換係数の数、および1つ前のスキャン列に含まれる非0変換係数の数に基づいて導出するための構成である。
高周波領域コンテキスト導出部124hの備える周辺参照カウント部124iは、対象周波数成分に隣接する復号済みの変換係数を参照し、以下の式を用いて、cnt2’を導出する。なお、cnt2’のことを限定参照カウントとも呼称する。
cnt2’=(c1!=0)+(c3!=0)
ここで、c1、c3は、図21の(a)に示す、対象周波数成分xの周辺の周波数成分について復号された変換係数である。
高周波領域コンテキスト導出部124hの備える前スキャン列非0変換係数カウント部124jは、以下の式を用いて、cnt3を導出する。
cnt3=(last_cnt>THc)? 1:0
ここで、閾値THcとしては、例えば、THc=1を用いればよいが、これは本実施形態を限定するものではなく、THcとして、uiPosX、uiPosYに依存する閾値を用いてもよい。より具体的には、対象周波数成分が属するスキャン列に沿った周波数成分の数と正の相関を有する閾値を用いてもよい。
また、last_cntは、上述のように、1つ前のスキャン列において出現した非0変換係数の数を示している。
また、前スキャン列非0変換係数カウント部124jは、以下の式を用いて、cnt3を導出する構成としてもよい。
cnt3=(last_cnt2>THc)? 1:0
ここで、last_cnt2は、2つ前のスキャン列において出現した非0変換係数の数を示している。
図20は、スキャン順が逆スキャン順である場合の、処理対象のスキャン列Lx、1つ前のスキャン列Lx+1及び2つ前のスキャン列Lx+2の例を示している。
前スキャン列非0変換係数カウント部124jは、現スキャン列に関する処理が終了した後、次のスキャン列に関する処理を行う際に、例えば、以下のように、last_cnt、last_cnt2を更新する。
last_cnt2=last_cnt
last_cnt=curr_cnt
ここで、curr_cntは、上述のように、現スキャン列の非0変換係数の数を表している。
本構成例に係る周辺参照コンテキスト導出部124hは、周辺参照カウント部124iによって導出したcnt2’、及び前スキャン列非0変換係数カウント部124jによって導出されたcnt3を参照し、部分領域R3に属する周波数成分に対して、以下の式を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+13+min(3、cnt2’+cnt3)
以上のように、本構成例に係る係数有無フラグ復号部によれば、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数と、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数とに基づいて導出するものであり、上記複数の部分領域のうち高周波数側の部分領域において設定される上記参照領域は、低周波数側の部分領域において設定される上記参照領域よりも小さいので、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量をより効果的に削減できると共に、高い符号化効率を実現することができる。
なお、周辺参照カウント部124iは、以下の式を用いて、cnt2’を導出する構成としてもよい。
cnt2’=pref_y_flag? cnty’:cntx’
ここで、優先参照カウントcnty’は、例えば、図21(b)に示す参照周波数成分について復号済みの変換係数c3、c5を用いて、
cnty’=(c3!=0)+(c5!=0)
によって導出する構成としてもよいし、図21(c)に示す参照周波数成分について復号済みの変換係数c1、c2を用いて、
cntx’=(c1!=0)+(c2!=0)
によって導出する構成としてもよい。
<係数有無フラグ復号部の第6の構成例>
本実施形態に係る係数有無フラグ復号部の第6の構成例について、図22を参照して説明する。図22は、本構成例に係る係数有無フラグ復号部124−4の構成を示すブロック図である。
図22に示すように、本構成例に係る係数有無フラグ復号部124−4は、周波数分類部124a、低周波位置コンテキスト導出部124b、及び周辺参照コンテキスト導出部124kを備えている。なお、上記第1〜第4の構成例で示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
本構成例において、上記第1の構成例と異なるのは、部分領域R1〜R3に属する周波数成分に対するコンテキストインデックスctxIdxの導出方法である。
したがって、本構成例においても、部分領域R0に属する周波数成分に対しては、上記第1の構成例と同様に、以下の式を用いてコンテキストインデックスctxIdxを導出する。
ctxIdx=NX+2×uiPosX + uiPosY
一方、部分領域R1に属する周波数成分に対しては、周辺参照コンテキスト導出部124kが以下の方法により、コンテキストインデックスctxIdxを導出する。
ctxIdx=NX+3+min(4、pref_y_flag? cnty:cntx)
また、部分領域R2に属する周波数成分に対しては、周辺参照コンテキスト導出部124kが以下の方法により、コンテキストインデックスctxIdxを導出する。
ctxIdx=NX+8+min(4、pref_y_flag? cnty:cntx)
また、部分領域R3に属する周波数成分に対しては、周辺参照コンテキスト導出部124kが以下の方法により、コンテキストインデックスctxIdxを導出する。
ctxIdx=NX+13+min(4、pref_y_flag? cnty:cntx)
ここで、pref_y_flag、cnty、cntxについては上述したためここでは説明を省略する。
以上のように、本構成例に係る係数有無フラグ復号部によれば各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出するものであり、上記参照領域に含まれる復号済みの変換係数の数は、4以下であるので、従来の構成よりも少ない数の復号済みの変換係数を参照すれば足りる。したがって、上記の構成によれば、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができると共に、高い符号化効率を実現できる。
(変換係数復号部120の他の構成例1)
以上、本実施形態に係る変換係数復号部120について、主に係数有無フラグ復号部の構成例を中心に説明したが、本実施形態に係る変換係数復号部120の構成は、上記の例に限られるものではない。
例えば、符号化データ#1のシーケンスパラメータセットSPSに、高周波数成分の符号化を制限するフラグ(制限フラグ)high_coeff_restriction_flagを含める構成としてもよい。このような構成の場合、変換係数復号部120は、当該フラグhigh_coeff_restriction_flagを復号し、high_coeff_restriction_flag=0である場合には、処理対象の周波数領域に含まれる全ての周波数成分についての変換係数を復号し、high_coeff_restriction_flag=1である場合には、下記の条件
uiPosX+uiPosY<TH2
を満たす周波数成分についての変換係数のみを復号するよう制限する構成とする。
また、処理対象のTUが特定のサイズ(例えば、32×32や16×16)である場合にのみ、上記の制限を適用する構成としてもよい。
図23は、処理対象の周波数領域において、uiPosX+uiPosY<TH2を満たす周波数成分よりなる領域R0’と、それ以外の領域R1’とを示す図である。図23において、領域R0’に含まれる周波数成分については変換係数が復号され、領域R1’に含まれる周波数成分については変換係数は復号されず、一律に既定値(例えば0)に設定される。
また、上記閾値TH2は、例えば、固定値としてTH2=14を用いる構成としてもよいし、閾値TH2の値を示すシンタックスを符号化データ#1に含める構成としてもよい。
閾値TH2の値を示すシンタックスとしては、例えば、(TH2−14)/2の値を示すシンタックスsps_coeff_restriction_value_minus14_div2を用いればよい。
また、レベルに応じて、上記の制限を適用するか、しないかを決定する構成としてもよい。ここで、レベルとは、シンタックスで用いられる値の範囲を制限する制限を意味する。レベルは0から所定の値までの制限に区分けされ、小さい値のレベルの方が厳しい制限となるようにする。レベルは、特に復号の複雑さを制限するために用いられ、画像の幅や高さ、フレームレートなどが制限対象のシンタックスに含まる。また、プロファイルは、使用するツールの制限に用いられる。ツールによってシンタックスが異なる場合にはプロファイルによりシンタックスが変化する。レベルはプロファイル毎に定められる。なお、プロファイルおよびレベルは、例えば、シーケンスパラメータセットで符号化するものとするが、これに限られるものではない。
例えば、図24(a)に示すように、レベルが0〜2の場合には、制限ありとし、レベルが3以上の場合には、制限なしとする構成としてもよい。
さらに、レベルに応じて適応的に閾値を変更する構成としてもよい。例えば、図24(b)に示すように、レベルが0か1である場合には、上記制限でTH2=14としたものを適用し、レベルが2である場合には、上記制限でTH2=22としたものを適用し、レベルが3である場合には、上記制限でTH2=30としたものを適用し、レベルが4である場合には、制限を適用しない構成としてもよい。
なお、シンタックスで用いられる値の範囲を制限する場合にも、制限する範囲を判定する判定式として、周波数領域の位置のX座標とY座標の和と閾値との比較を行う以下の式の他、
uiPosX+uiPosY<TH2
周波数領域の位置をサブブロックの大きさ(ここでは4)で割って得られるサブブロック位置を用いて、以下の式のように、サブブロック座標のX座標とY座標の和と閾値との比較を行っても良い。
(uiPosX>>2)+(uiPosY>>2)<(TH2>>2)
すなわち、上記対象周波数領域のサイズをszと表すとき、処理量削減と符号化効率削減のバランス上は、上記閾値THおよびTH2は、判定にX座標及びY座標の和を用いる場合にはsz以下の値、サブブロックのX座標及びY座標の和を用いる場合には、sz/サブブロック以下の大きさを有することが好ましい。上記TH、TH2はこの関係を満たす。
さらに、上記対象周波数領域のサイズをszと表すとき、周辺の周波数成分が参照可能か否かの判定を省略するためには、上記閾値THおよびTH2は、判定にX座標及びY座標の和を用いる場合にはsz未満の値、サブブロックのX座標及びY座標の和を用いる場合には、sz/サブブロック未満の大きさを有することが好ましい。上記TH、TH2はこの関係を満たす。
また、閾値は、対象周波数領域の大きさに応じて定めても良い。例えば、以下の式のように、対象周波数領域の幅と高さの最大値を右シフトした値、及び、右シフト後に所定の値を加算または減算した値を用いても良い。
TH2=3×Max(width、height)>>4
TH2=(3×Max(width、height)>>4)+4
上記のように構成された符号化データ#1によれば、各単位領域に対応する各対象周波数領域における高周波数側の変換係数を復号するか否かを示す制限フラグを含んでおり、変換係数復号部120は、上記制限フラグが、高周波数側の変換係数を復号しないことを示している場合には、当該高周波数側の変換係数の復号処理を省略することができるので、変換係数を復号するための処理量が削減される。
(変換係数復号部120の他の構成例2)
また、対象TUのサイズが8×8画素等の比較的小さいサイズである場合、変換係数復号部120の備える係数有無フラグ復号部は、以下の式を用いてコンテキストインデックスctxIdxを導出し、各周波数成分に割り付ける構成としてもよい。
ctxIdx=N8+4×tbl[uiPosY]+tbl[uiPosX]
ここで、
tbl={0、1、1、2、2、3、3、3}
である。
ここで、N8は、周波数領域のサイズが8×8の場合のコンテキストインデックスの開始点である。
本構成例に係る係数有無フラグ復号部は、ビット復号部132から供給されるBinを解釈し、復号対象の周波数成分に割り付けられたコンテキストインデックスctxIdxを用いて、当該復号対象の周波数成分についてのシンタックスsignificant_coeff_flagを復号する。復号されたシンタックスsignificant_coeff_flagは、復号係数記憶部126に格納され、係数値復号部125によって参照される。また、復号の際に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
図25(a)は、比較例に係る係数有無フラグ復号部によって導出されたコンテキストインデックスctxIdxの各値を示しており、図25(b)は、本構成例に係る係数有無フラグ復号部によって導出されたコンテキストインデックスctxIdxの各値を示している。
ここで、比較例に係る係数有無フラグ復号部は、コンテキストインデックスctxIdxを、
ctxIdx=N8+4×tbl[uiPosY]+tbl[uiPosX]
tbl={0、0、1、1、2、2、3、3}
によって導出するものである。
図25(b)に示すように、本構成例に係る係数有無フラグ復号部は、比較例に係る係数有無フラグ復号部に比べて、低周波数成分に対して、よりきめ細かくコンテキストインデックスctxIdxを付与する。
また、図25(b)に示すように、本構成例に係る係数有無フラグ復号部は、高周波数成分側よりも、低周波数成分側をより小さな領域に分割し、各領域に対して互いに異なるコンテキストインデックスctxIdxを付与する。
本構成例に係る係数有無フラグ復号部は、上記の構成をとることによって、低周波数成分側のsignificant_coeff_flagを効率的に復号することができるので、符号化効率が向上する。
なお、本構成例に係る係数有無フラグ復号部によるコンテキストインデックスctxIdxの導出処理は、上記の例に限られるものではなく、例えば、PosX=0近傍の周波数成分を細かく分割するように、以下の式を用いてctxIdxHを算出し、その各値をコンテキストインデックスctxIdxに設定する構成としてもよい。
ctxIdxH=N8+4×(uiPosY>>1)+tbl[uiPosX]
tbl={0、1、1、2、2、3、3、3}
図25(c)は、本構成例に係る係数有無フラグ復号部によって導出されたctxIdxHの例を示している。
このような構成をとることによって、PosX=0近傍の周波数成分についてのsignificant_coeff_flagを効率的に復号することができるので、符号化効率が向上する。
また、PosY=0近傍の周波数成分を細かく分割するように、以下の式を用いてctxIdxVを算出し、その各値をコンテキストインデックスctxIdxに設定する構成としてもよい。
ctxIdxV=N8+4×tbl[uiPosY]+(uiPosX>>1)
tbl={0、1、1、2、2、3、3、3}
図25(d)は、本構成例に係る係数有無フラグ復号部によって導出されたctxIdxVの例を示している。
このような構成をとることによって、PosY=0近傍の周波数成分についてのsignificant_coeff_flagを効率的に復号することができるので、符号化効率が向上する。
また、本構成例に係る係数有無フラグ復号部は、上述した垂直優先フラグpref_y_flagの値を参照し、その値に応じて、ctxIdxVを用いるのか、ctxIdxHを用いるのかを切り替える構成としてもよい。より具体的には、
ctxIdx=pref_y_flag? ctxIdxV:ctxIdxH
によってコンテキストインデックスctxIdxを導出する構成としてもよい。
このような構成とすることによって、変換係数の偏りに応じて、より適切なコンテキストインデックスctxIdxを用いることができるので、符号化効率が向上する。
以上のように、本構成例に係る係数有無フラグ復号部は、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割し、各部分領域に対して、互いに異なるコンテキストインデックスを割り付けるコンテキストインデックス割り付け、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグを、該変換係数有無フラグが属する部分領域に割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するものであり、上記複数の部分領域のうち低周波数側の部分領域は、高周波数側の部分領域よりも小さいので、低周波数側の領域に対して、コンテキストインデックスをきめ細かく割り当てることができる。したがって、上記の構成によれば、低周波数側のシンタックスを効率的に復号することができるので、符号化効率が向上する。
(サブブロック単位での係数有無フラグの復号処理例)
本実施形態に係る係数有無フラグ復号部は、周波数領域の全体を1つのブロック(変換ブロック)として係数有無フラグを復号するのではなく、周波数領域の全体を示す1つのブロックをたとえば4×4のサブブロックに分割し、サブブロックの単位で係数有無フラグを復号する構成としてもよい。
図32はサブブロックスキャンを示す図である。ここで、サブブロックスキャンとは、サブブロックを単位とするスキャンのことを指す。係数有無フラグ復号部は、図32に示すように、例えば、周波数領域全体に対応する1つのブロックを、uiPosX方向に4個、uiPosY方向に4個の合計16個のサブブロックに分割すると共に、サブブロックを処理単位として係数有無フラグを復号する。
サブブロックを用いて係数有無フラグを復号する場合には、図32(a)に示すように、係数有無フラグ復号部は、サブブロック単位で、サブブロック内に少なくとも1つの非0変換係数が存在するか否かを示すフラグ(サブブロック係数有無フラグsignificant_coeffgroup_flag)をサブブロック逆スキャン順(図32のブロック内に示す矢印方向)に復号する。さらに、サブブロック係数有無フラグsignificant_coeffgroup_flagが非0である場合において、図32(b)に示すように、係数有無フラグ復号部は、処理対象のサブブロック内部の各変換係数について有無フラグをサブブロック内部の逆スキャン順(図32のサブブロック内に示す矢印方向)に復号する。
なお、図32(a)に示すサブブロックスキャンのスキャン順、および図32(b)に示すサブブロック内スキャンのスキャン順はあくまで一例であり、他のスキャン順を用いてもよい。たとえばジグザグスキャン、水平優先スキャン、垂直優先スキャンを用いてもよい。
以下では、サブブロック単位でサブブロック非ゼロ係数有無フラグ、非ゼロ係数有無フラグを復号/符号化する場合の例を説明する。
まず、図47を用いて、変換ブロックのサイズを16×16、サブブロックのサイズを4×4とするときの、サブブロック係数有無フラグの例を説明する。
図47(a)は、16×16変換ブロックに含まれる合計256個の周波数成分についての量子化残差係数の各値の一例である。また、図47(b)は、16×16変換ブロックを4×4サブブロックに分割した場合の各サブブロックを識別するサブブロック番号の一例を示す図である。図47(c)は、量子化残差係数が図47(a)に示すものであるときの、各サブブロックのサブブロック係数有無フラグの一例を示している。
図47(a)において、符号W1はラスト係数の位置を表す。また、図47(a)において、淡色にて表されているゼロ係数は、順スキャン順で、ラスト係数W1より後ろのゼロ係数である。また、図47(a)において、符号SBK_A〜ABK_Dにて示されるサブブロック(図47(b)においてサブブロック番号3,7,12,13を付したサブブロック)では、量子化残差係数の値がすべてゼロとなっている。
このような状況において、従来通り、非ゼロ係数の有無を、DC係数からラスト係数までの係数毎に係数有無フラグによって表わす場合、計218個の係数有無フラグが必要である。
一方、非ゼロ係数の有無を、サブブロック単位で表現する場合、図47(a)のサブブロック毎の非ゼロ係数があるか否かを表すサブブロック係数有無フラグは、図47(c)に示すように表現される。すなわち、サブブロック(図47(b)におけるサブブロック番号3,7,12,13,15)では、非ゼロ係数の個数が0であるため、サブブロック係数有無フラグsignificant_coeffgroup_flagは「0」と設定され、各サブブロック内の係数有無フラグは付加されない。
また、サブブロック(図47(b)におけるサブブロック番号0,1,2,4,5,6,8,9,10,11)は、非ゼロ係数の個数が1以上であるため、サブブロック係数有無フラグsignificant_coeffgroup_flagは「1」と設定され、各サブブロック内の係数有無フラグが付加される。
すなわち、非ゼロ係数の有無を、サブブロック単位に表現する場合は、係数有無フラグの個数は、サブブロック(図47(b)におけるサブブロック番号3,7,12,13)内の計64個の係数有無フラグが削減され、計154個となる。追加で16個のサブブロック係数有無フラグが必要となるが、フラグ数は合わせても170個であり、少なくとも従来に比べて、48個のフラグが削減される。このように、サブブロック単位で変換係数の有無を表わすことで、符号化/復号の対象となる係数有無フラグが大幅に削減される。つまり、係数有無フラグの符号化/復号に必要なコンテキスト導出処理が削減されるため、符号化/復号のスループットを向上させることが可能となる。
続いて、以下では、係数有無フラグをサブブロック単位に復号する場合の実施例について説明する。
<係数有無フラグ復号部の第7の構成例>
図31は、本実施形態に係る係数有無フラグ復号部の第7の構成例としての係数有無フラグ復号部124−Aを示すブロック図である。また、図33は、係数有無フラグ復号部124−Aにおける復号処理の流れを示すフローチャートである。
図31に示すように、本構成例に係る係数有無フラグ復号部124−Aは、サブブロック係数有無フラグ復号部X1、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124cを備えている。
(サブブロック係数有無フラグ復号部X1)
サブブロック係数有無フラグ復号部X1は、ビット復号部132より供給されるBinを解釈し、周波数領域を構成する各サブブロックの中に少なくとも1つ非0の変換係数が存在するか否かを示すサブブロック係数有無フラグ(significant_coeffgroup_flag)を復号する(図33のステップSY1)。
なお、サブブロックのスキャン順は、図32(a)に示すように、ラスト係数のあるサブブロックからDC係数のあるサブブロックに向かって復号してもよいし、その逆でもよい。また、既に復号したサブブロックのサブブロック係数有無フラグに応じて、サブブロック係数有無フラグを符号化データからデータを復号せずに定める方法でもよい。すなわち、隣接する2つのサブブロックのサブブロック係数有無フラグが1であれば、サブブロック係数有無フラグを符号化データからデータを復号せずにサブブロック係数有無フラグを1に定め、それ以外の場合には、サブブロック係数有無フラグを符号化データから復号する構成でもよい。
続いて、係数有無フラグ復号部124−Aは、変換ブロック内にあるサブブロック毎に、サブブロック内にある係数有無フラグを復号する(図33のステップSY2〜ステップSY4)。すなわち、サブブロック係数有無フラグ復号部X1において、サブブロック係数有無フラグが1の場合(図33のステップSY2においてYの場合)、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124cを用いてサブブロック内の係数有無フラグを復号する。また、サブブロック係数有無フラグが0の場合(図33のステップSY2においてNの場合)、サブブロック内の係数有無フラグの復号をスキップし、次のサブブロックの処理へ移行する。
なお、図34に示すように、サブブロックのループの中で、対象サブブロック(xCG、、yCG)のサブブロック係数有無フラグを復号しても良い。ここで、図34におけるステップSY5では、サブブロック係数有無フラグ復号部X1が、(xCG、yCG)によって指定されるサブブロックについてのサブブロック係数有無フラグsignificant_coeffgroup_flagを復号する。
なお、図33、図34のサブブロックのループにおいて、sbkIdxは、サブブロックの順スキャンでの対象サブブロックのスキャン順番号を表し、LastSbkIdxは、サブブロックの順スキャンでのラスト係数のあるサブブロックのスキャン順番号を表わす。sz×szの変換ブロックを4×4サブブロックに分割する場合、sbkIdx、およびLastSbkIdxのとる値は、0〜(sz>>2)×(sz>>2)-1である。
(係数有無フラグ復号部124−Aの備える周波数分類部124a)
係数有無フラグ復号部124−Aの備える周波数分類部124aは、周波数領域における復号対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部124b、及び周辺参照コンテキスト導出部124cの何れかによって導出されたコンテキストインデックスctxIdxを、当該復号対象の周波数成分に割り付ける(図33のステップSY3)。
係数有無フラグ復号部124−Aの備える周波数分類部124aは、周波数領域に含まれる各周波数成分の当該周波数領域における位置(uiPosX、uiPosY)を用いて、当該周波数成分を複数の部分領域R0〜R2に分類する。ここで、uiPosX=0、1、...、sz−1であり、uiPosY=0、1、...、sz−1であるとする(szは、上述のように処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表しており、例えば、sz=16,32等である)。
ここで、sz×szブロックの周波数領域を4×4サブブロックに分割し、当該周波数成分(uiPosX、uiPosY)が属するサブブロックの位置を(xCG,yCG)とする。なお、当該周波数成分が属するサブブロック位置(xCG,yCG)は下記式(eq.A1)〜(eq.A2)により導出される。
xCG=uiPosX>>2 ・・・(eq.A1)
yCG=uiPosY>>2 ・・・(eq.A2)
ここで、xCG=0、1、...、(sz−1)>>2であり、yCG=0、1、...、(sz−1)>>2であるとする。
係数有無フラグ復号部124−Aの備える周波数分類部124aは、より具体的には、以下の分類処理を行う。
(1)xCG+yCG<THA、かつ、uiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)xCG+yCG<THA、かつ、THZ≦uiPosX+uiPosYを満たす周波数成分を部分領域R1に分類する。
(3)THA≦xCG+yCGを満たす周波数成分を部分領域R2に分類する。
上記分類処理に対応する疑似コードは次の通りである。
********************************************************************
if( xCG+yCG<THA){
if( uiPosX+uiPosY<THZ ) {
R0へ分類
}
else{// if( uiPosX+uiPosY>=THZ)
R1へ分類
}
else{//if( xCG+yCG>=THA ){
R2へ分類
}
}
********************************************************************
ここで、閾値THZとして2を用いる。THAは、THA≧THZ/4を満たす閾値を表している。具体的な値としては、例えば、周波数領域のサイズ(処理対象TUのサイズ)に関わらず、THA=1とすればよい。また、周波数領域のサイズlog2TrafoSizeを用いて、THA=1<<(log2TrafoSize-2)としてもよい。すなわち、周波数領域のサイズが16×16である場合、THA=1とし、周波数領域のサイズが32×32である場合、THA=2としてもよい。このように、周波数領域のサイズに応じて、異なる閾値を用いる構成としてもよい。また、閾値THZを1としても良い。
図35は、係数有無フラグ復号部124−Aの備える周波数分類部124aによる分類処理によって、部分領域R0、R1、及びR2に分割された周波数領域の一例を示している。
係数有無フラグ復号部124−Aの備える周波数分類部124aは、部分領域R0に属する周波数成分に対して、低周波位置コンテキスト導出部124bによって導出されたコンテキストインデックスを割り付け、部分領域R1及びR2に属する周波数成分に対して、周辺参照コンテキスト導出部124cによって導出されたコンテキストインデックスを割り付ける。なお、サブブロックのサイズとして、4×4を例に説明したが、これに限定されず、(sz>>n)×(sz>>n)のサブブロックでもよい。ただし、nは、nは、n=1,…,log2TrafoSize>>1を満たすものとする。
また、係数有無フラグ復号部124−Aの備える周波数分類部124aは、算術符号復号部130でシンタックスsignificant_coeff_flagを復号するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズおよび復号対象の周波数成分毎に算出される(図33のステップSY4)。復号されたシンタックスsignificant_coeff_flagは、復号係数記憶部126に格納され、係数値復号部125によって参照される。また、復号の際に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
以下では、各部分領域R0〜R2に対応するコンテキスト導出について具体的に説明する。
(係数有無フラグ復号部124−Aの備える低周波位置コンテキスト導出部124b)
係数有無フラグ復号部124−Aの備える低周波位置コンテキスト導出部124bは、復号対象の周波数成分が、低周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出する。
係数有無フラグ復号部124−Aの備える低周波位置コンテキスト導出部124bは、部分領域R0に属する周波数成分に対して、以下の式(eq.A3)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+2×uiPosX + uiPosY ・・・(eq.A3)
なお、NXはコンテキストインデックスの開始点を表す定数である。周波数領域のサイズが4×4及び8×8で用いるコンテキスト数が各々N4個、N8個の場合には、周波数領域のサイズが16×16および32×32の開始点はNX=N4+N8になる。
(係数有無フラグ復号部124−Aの備える周辺参照コンテキスト導出部124c)
係数有無フラグ復号部124−Aの備える周辺参照コンテキスト導出部124cは、復号対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について復号済みの非0変換係数の数cntに基づいて導出する。
係数有無フラグ復号部124−Aの備える周辺参照コンテキスト導出部124cは、部分領域R1に属する周波数成分に対して、以下の式(eq.A4)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+3+min(2,temp) ・・・(eq.A4)
ここで、tempは、
temp=(cnt+1)>>1
によって定まる。
また、係数有無フラグ復号部124−Aの備える周辺参照コンテキスト導出部124cは、部分領域R2に属する周波数成分に対して、以下の式(eq.A5)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+6+min(2,temp) ・・・(eq.A5)
ここで、tempは、上記の場合と同様に、
temp=(cnt+1)>>1
によって定まる。
なお、式(eq.A4)〜(eq.A5)において、非0変換係数のカウント数cntを1ビット右シフトすることで、コンテキスト数を削減することが可能である。
また、周辺参照コンテキスト導出部124cは、部分領域R1において、非0変換係数のカウント数cntを、図10(a)または図10(b)に示す参照周波数成分c1〜c5を用いて、以下の式(eq.A6)によって導出する。
cnt=(c1!=0)+(c2!=0)+(c3!=0)+(c4!=0)+(c5!=0) ・・・(eq.A6)
ここで、(eq.A6)における各項は、()内の比較が真である場合に1をとり、()内の比較が偽である場合に0をとるものとする。
また、非0変換係数の数cntを、式(eq.6)の代わりに、図36(a)に示す参照周波数成分(c1、c2、c4、c5)を用いて、対象とする変換係数の位置の、処理順で直前(処理順が逆スキャン順である場合には、対象とする変換係数の位置の下側)に位置する座標(c3)の変換係数を参照しないようにした数式(eq.A7)によって算出してもよい。このような処理は、ある位置の係数有無フラグの復号に用いるコンテキスト導出を、直前の係数有無フラグの値を参照せずに行うことができるため、コンテキスト導出処理と復号処理とを並列に処理することができる。
cnt=(c1!=0)+(c2!=0)+(c4!=0)+(c5!=0)・・・(eq.A7)
また、対象とする変換係数のサブブロック内の位置に応じて、数式(eq.A6)と数式(eq.A7)との何れかを用いて変換係数を導出する構成としてもよい。すなわち、対象とする変換係数のサブブロック内の位置に応じて、変換係数の導出に用いる参照成分を変更する構成としてもよい。
より具体的には、対象とする変換係数がサブブロック内の左上に位置する場合と、対象とする変換係数がサブブロック内の右下に位置する場合とのいずれか一方において、サブブロック内での対象とする変換係数の処理順で直前の位置(ここでは下側)の変換係数の値に依存しないように、数式(eq.A7)の参照周波数成分を用い、それ以外の場合には、数式(eq.A6)の参照周波数成分を用いてもよい。
以上のように、本構成例に係る係数有無フラグ復号部124−Aによれば、周波数分類部124aにおいて、サブブロック座標に基づいて周波数成分の分類を行うことによって、サブブロック座標(xCG、yCG)がxCG+yCG>0を満たす場合において、サブブロック内における周波数分類を行う分岐処理を省略することができる。既に説明した分類、たとえば、
・uiPosX+uiPosY<2を満たす周波数成分を部分領域R0に分類する。
・2≦uiPosX+uiPosY<TH1を満たす周波数成分を部分領域R1に分類する。
・TH1≦uiPosX+uiPosY<TH2を満たす周波数成分を部分領域R2に分類する。
・TH2≦uiPosX+uiPosYを満たす周波数成分を部分領域R3に分類する。
上記のような分類を行う場合には、サブブロック内部で上記分類を行う分岐処理が必要である。しかしながら、本構成例においては、分類処理において参照する座標をブロック全体における座標(uiPosX、uiPosY)ではなくサブブロック座標(xCG、yCG)に置き換えることができるので、(uiPosX、uiPosY)を参照する上記分岐が不要である。これによって、サブブロック内のコンテキストインデックス導出における遅延を削減し、コンテキスト導出のスループットを向上させることができる。
また、以上の構成では、サブブロックごとのサブブロック係数有無フラグとサブブロック内の係数有無フラグを組み合わせて、非0係数の有無を復号する。この構成では、サブブロック内の係数有無フラグの復号に用いるコンテキスト導出を簡略化することができる。すなわち、図36(a)に示すように参照数を4つに減らすことができる。
なお、上記の例では、周波数成分を3つの部分領域に分類したが、2つの部分領域に分類する方法でも良い。この場合、
(1)uiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)THZ≦uiPosX+uiPosYを満たす周波数成分を部分領域R1に分類する。
部分領域R0の係数有無フラグの復号に用いるコンテキスト導出は、上記のとおりであり、部分領域R1の係数有無フラグの復号に用いるコンテキスト導出は、
ctxIdx=NX+3+min(2,temp) ・・・(eq.A4)
temp=(cnt+1)>>1
を用い、さらにcntは4点参照、例えば、数式(eq.A7)を用いる構成でも良い。この構成では、サブブロック内の係数有無フラグの復号に用いるコンテキスト導出を簡略化することができる。
また、次の条件によりR0、R1へ分類してもよい。
(1)xCG+yCG==0かつuiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)xCG+yCG>0もしくはTHZ≦uiPosX+uiPosYを満たす周波数成分を部分領域R1に分類する。
上記分類処理に対応する疑似コードは次の通りである。
*******************************************************************
if ( xCG+yCG==0 ){
if( uiPosX+uiPosY<THZ ){
R0へ分類
}
else {// if( uiPosX+uiPosY>=THZ)
R1へ分類
}
}
else{//if( xCG+yCG>0 )
R1へ分類
}
*******************************************************************
上記分類処理によれば、サブブロック位置(xCG、yCG)が(0、0)以外の部分におけるサブブロック内での周波数成分を分類するための分岐処理をなくすことができる。
以上のように、係数有無フラグ復号部124−Aの備える周波数分類部124aは、高周波数側において、対象周波数領域における当該対象サブブロックの位置を参照して、周波数領域を部分領域に分割する。
また、周辺参照コンテキスト導出部124cは、このような分割により得られた部分領域に属する係数有無フラグの復号に用いるコンテキストを導出する。
したがって、係数有無フラグ復号部124−Aは、対象サブブロックが対象周波数領域において高周波数側の部分領域に属するものである場合、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出するものである、と表現することもできる。
以下では、係数有無フラグ復号部の第7の構成例において、変換ブロックサイズが16×16、32×32のときに、周波数領域を部分領域R0、R1へ分割し、R0では低周波位置コンテキスト、R1では、図36(a)に示す4つの参照周波数成分(c1、c2、c4、c5)による周辺参照コンテキストによりコンテキストインデックスctxIdxを導出する場合の疑似コードを示す。なお、疑似コード中のsigCtxは、ctxIdxと同義である。
*******************************************************************
If log2TrafoSize is less than or equal to 3, sigCtx is derived as follows.
shift = log2TrafoSize = = 3 ? 1 : 0 sigCtx = ( shift * 15 ) + ( ( yC >> shift ) << 2 ) + ( xC >> shift )
If cIdx is equal to 0 and log2TrafoSize is larger than 3, sigCtx is derived as follows
If xC + yC is less than 1, sigCtx is derived as follows.
sigCtx = 31
Otherwise if (xC>>2) + (yC>>2) is less than 1 << (uiLog2BlkSize-4), sigCtx is derived as follows.
temp = significant_coeff_flag[ xC + 1 ][ yC ] + significant_coeff_flag[ xC + 2 ][ yC ] + significant_coeff_flag[ xC ][ yC + 1 ] + significant_coeff_flag[ xC + 1 ][ yC + 1 ] + significant_coeff_flag[ xC ][ yC + 2 ] temp = ( temp + 1) >>1 sigCtx = 32 + Min( 2, temp )
Otherwise ((xC>>2) + (yC>>2) is greater than or equal to 1 << (uiLog2BlkSize-4))), sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flag as follows.
The variable ctxCnt is initialized as follows.
ctxCnt = 0
When xC is less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC ]
When xC and yC are less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC + 1 ]
When xC is less than ( 1 << log2TrafoSize ) ? 2, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 2 ][ yC ]
When yC is less than ( 1 << log2TrafoSize ) ? 2 and ctxCnt is less than 3,the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC ][ yC + 2 ]
ctxCnt =(ctxCnt + 1) >>1 sigCtx = 35 + ctxCnt
If cIdx is greater than 0 and log2TrafoSize is larger than 3, sigCtx is derived as follows
If xC + yC is less than 1, sigCtx is derived as follows.
sigCtx = 31
Otherwise (xC + yC is greater than or equal to 1), sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flag as follows.
The variable ctxCnt is initialized as follows.
ctxCnt = 0
When xC is less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC ]
When xC and yC are less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC + 1 ]
When xC is less than ( 1 << log2TrafoSize ) ? 2, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 2 ][ yC ]
When yC is less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC ][ yC + 1 ]
When yC is less than ( 1 << log2TrafoSize ) ? 2 and ctxCnt is less than 3, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC ][ yC + 2 ]
ctxCnt =((ctxCnt + 1) >>1 sigCtx = 32 + ctxCnt
*******************************************************************
以下では、係数有無フラグ復号部の第7の構成例において、変換ブロックサイズが16×16、32×32のときに、周波数領域を部分領域R0、R1、R2へ分割し、R0では低周波位置コンテキスト、R1では図10(a)に示す5つの参照周波数成分(c1、c2、c3、c4、c5)を、R2では、図36(a)に示す4つの参照周波数成分(c1、c2、c4、c5)を用いて周辺参照コンテキストによりコンテキストインデックスctxIdxを導出する場合の疑似コードを示す。なお、疑似コード中のsigCtxは、ctxIdxと同義である。
*******************************************************************
If log2TrafoSize is less than or equal to 3, sigCtx is derived as follows.
shift = log2TrafoSize = = 3 ? 1 : 0 sigCtx = ( shift * 15 ) + ( ( yC >> shift ) << 2 ) + ( xC >> shift )
If cIdx is equal to 0 and log2TrafoSize is larger than 3, sigCtx is derived as follows
If xC + yC is less than 1, sigCtx is derived as follows.
sigCtx = 31
Otherwise if xC + yC is less than 1 << (uiLog2BlkSize-2), sigCtx is derived as follows.
temp = significant_coeff_flag[ xC + 1 ][ yC ] + significant_coeff_flag[ xC + 2 ][ yC ] + significant_coeff_flag[ xC ][ yC + 1 ] + significant_coeff_flag[ xC + 1 ][ yC + 1 ] + significant_coeff_flag[ xC ][ yC + 2 ] temp = ( temp + 1) >>1 sigCtx = 32 + Min( 2, temp )
Otherwise (xC + yC is greater than or equal to 1 << (uiLog2BlkSize-2)), sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flag as follows.
The variable ctxCnt is initialized as follows.
ctxCnt = 0
When xC is less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC ]
When xC and yC are less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC + 1 ]
When xC is less than ( 1 << log2TrafoSize ) ? 2, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 2 ][ yC ]
When yC is less than ( 1 << log2TrafoSize ) ? 2 and ctxCnt is less than 3, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC ][ yC + 2 ]
ctxCnt =(ctxCnt + 1) >>1 sigCtx = 35 + ctxCnt
If cIdx is greater than 0 and log2TrafoSize is larger than 3, sigCtx is derived as follows
If xC + yC is less than 1, sigCtx is derived as follows.
sigCtx = 31
Otherwise if xC + yC is less than 1 << (uiLog2BlkSize-2), sigCtx is derived as follows.
temp = significant_coeff_flag[ xC + 1 ][ yC ] + significant_coeff_flag[ xC + 2 ][ yC ] + significant_coeff_flag[ xC ][ yC + 1 ] + significant_coeff_flag[ xC + 1 ][ yC + 1 ] + significant_coeff_flag[ xC ][ yC + 2 ]
temp = ( temp + 1) >>1 sigCtx = 32 + Min( 2, temp )
Otherwise (xC + yC is greater than or equal to 1 << (uiLog2BlkSize-2)), sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flag as follows.
The variable ctxCnt is initialized as follows.
ctxCnt = 0
When xC is less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC ]
When xC and yC are less than ( 1 << log2TrafoSize ) ? 1, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 1 ][ yC + 1 ]
When xC is less than ( 1 << log2TrafoSize ) ? 2, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC + 2 ][ yC ]
When yC is less than ( 1 << log2TrafoSize ) ? 2 and ctxCnt is less than 3, the following applies.
ctxCnt = ctxCnt + significant_coeff_flag[ xC ][ yC + 2 ]
ctxCnt =(ctxCnt + 1) >>1 sigCtx = 32 + ctxCnt
*******************************************************************
<係数有無フラグ復号部の第8の構成例>
図37は、本実施形態に係る係数有無フラグ復号部の第8の構成例としての係数有無フラグ復号部124−Bを示すブロック図である。本構成例に係る係数有無フラグ復号部124−Bにおける復号処理の流れは、図33に示したフローチャートを参照して説明される。
図37に示すように、本構成例に係る係数有無フラグ復号部124−Bは、サブブロック係数有無フラグ復号部X1、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、高周波位置コンテキスト導出部124dを備えている。
(係数有無フラグ復号部124−Bの備えるサブブロック係数有無フラグ復号部X1)
係数有無フラグ復号部124−Bの備えるサブブロック係数有無フラグ復号部X1は、ビット復号部132より供給されるBinを解釈し、周波数領域を構成する各サブブロックの中に少なくとも1つ非0の変換係数が存在するか否かを示すサブブロック係数有無フラグ(significant_coeffgroup_flag)を復号する(図33のステップSY1)。
続いて、変換ブロック内にあるサブブロック毎に、サブブロック内にある変換係数有無フラグを復号する(図33のステップSY2〜ステップSY4)。すなわち、サブブロック係数有無フラグ復号部X1において、サブブロック係数有無フラグが1の場合(図33のステップSY2においてYの場合)、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、高周波位置コンテキスト導出部124dを用いてサブブロック内の係数有無フラグを復号する。また、サブブロック係数有無フラグが0の場合(図33のステップSY2においてNの場合)、サブブロック内の係数有無フラグの復号をスキップし、次のサブブロックの処理へ移行する。
(係数有無フラグ復号部124−Bの備える周波数分類部124a)
係数有無フラグ復号部124−Bの備える周波数分類部124aは、周波数領域における復号対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、及び高周波位置コンテキスト導出部124dの何れかによって導出されたコンテキストインデックスctxIdxを、当該復号対象の周波数成分に割り付ける(図33のステップSY3)。
係数有無フラグ復号部124−Bの備える周波数分類部124aは、周波数領域に含まれる各周波数成分の当該周波数領域における位置(uiPosX、uiPosY)を参照し、当該周波数成分を複数の部分領域R0〜R3に分類する。ここで、uiPosX=0、1、...、sz−1であり、uiPosY=0、1、...、sz−1であるとする(szは、上述のように処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表しており、例えば、sz=16,32等である)。
ここで、sz×szブロックの周波数領域を4×4サブブロックに分割し、当該周波数成分(uiPosX、uiPosY)が属するサブブロックの位置を(xCG,yCG)とする。なお、当該周波数成分が属するサブブロック位置(xCG,yCG)は下記式(eq.B1)〜(eq.B2)により導出される。
xCG=uiPosX>>2 ・・・(eq.B1)
yCG=uiPosY>>2 ・・・(eq.B2)
ここで、xCG=0、1、...、(sz−1)>>2であり、yCG=0、1、...、(sz−1)>>2であるとする。
係数有無フラグ復号部124−Bの備える周波数分類部124aは、より具体的には、以下の分類処理を行う。
(1)xCG+yCG<THB、かつ、uiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)xCG+yCG<THB、かつ、THZ≦uiPosX+uiPosY<TH1を満たす周波数成分を部分領域R1に分類する。
(3)xCG+yCG<THB、かつ、TH1≦uiPosX+uiPosY、かつ、を満たす周波数成分を部分領域R2に分類する。
(4)THB≦xCG+yCGを満たす周波数成分を部分領域R3に分類する。
上記分類処理に対応する疑似コードは次の通りである。
*******************************************************************
if( xCG+yCG<THB ) {
if( uiPosX+uiPosY<THZ){
R0へ分類
}
else if( uiPosX+uiPosY<TH1 ){
R1へ分類
} else{ //if(uiPosX+uiPosY>=TH1)
R2へ分類
}
else{// if(xCG+yCG>=THB)
R3へ分類
}
*******************************************************************
ここで、閾値THZには2を用いる。また、TH1及びTHBの具体的な値としては、例えば、周波数領域のサイズ(処理対象TUのサイズ)log2TrafoSizeを用いて、
TH1=5、
THB=1<<(log2TrafoSize-2)
とすればよい。また、周波数領域のサイズが16×16である場合、TH1=5、THB=4とし、周波数領域のサイズが32×32である場合、TH1=5、THB=8としてもよい。
また、閾値TH1及びTHBは周波数領域のサイズlog2TrafoSizeを用いて、
TH1=5、
THB=1<<(log2TrafoSize-4)
と設定してもよい。すなわち、周波数領域のサイズが16×16である場合、TH1=5、THB=1とし、周波数領域のサイズが32×32である場合、TH1=5、THB=2と設定する。また、他の値に設定することもできる。
また、閾値TH1、及びTHBを、
TH1=5、
THB=1<<(log2TrafoSize−3)
と設定してもよい。すなわち、周波数領域のサイズが16×16である場合、TH1=5、THB=2とし、周波数領域のサイズが32×32である場合、TH1=5、THB=4と設定する。このように、周波数領域のサイズに応じて、異なる閾値を用いる構成としてもよい。
以上のように構成された周波数分類部124aによれば、変換係数の位置によりコンテキスト導出方法を切り替えるための分岐処理を、サブブロック座標(xCG、yCG)を用いた分岐処理とすることにできる。(uiPosX、uiPosY)を参照する分岐処理を行う場合に比べて、サブブロック内部で行われる(uiPosX、uiPosY)を参照する分岐処理を省略することができ、コンテキスト導出のスループットを向上させることができる。
図38は、係数有無フラグ復号部124−Bの備える周波数分類部124aによる分類処理によって、部分領域R0、R1、R2、及びR3に分割された周波数領域の一例を示している。
係数有無フラグ復号部124−Bの備える周波数分類部124aは、部分領域R0に属する周波数成分に対して、低周波位置コンテキスト導出部124bによって導出されたコンテキストインデックスを割り付け、部分領域R1及びR2に属する周波数成分に対して、周辺参照コンテキスト導出部124cによって導出されたコンテキストインデックスを割り付け、部分領域R3に属する周波数成分に対して、高周波位置コンテキスト導出部124dによって導出されたコンテキストインデックスを割り付ける。
また、上記の説明においては、周波数分類部124aが、対象周波数成分の位置として(uiPosX、uiPosY)、及び対象周波数成分が属するサブブロックの位置(xCG,yCG)を参照するものとしたが、本実施形態はこれに限定されるものではない。例えば、対象周波数成分の位置として、順スキャン順または逆スキャン順に沿って付与された周波数成分識別インデックス(例えば図5における「n」)を参照し、対象周波数成分を複数の部分領域の何れかに分類する構成としてもよい。
また、係数有無フラグ復号部124−Bの備える周波数分類部124aは、算術符号復号部130でシンタックスsignificant_coeff_flagを復号するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズおよび復号対象の周波数成分毎に算出される(図33のステップSY4)。復号されたシンタックスsignificant_coeff_flagは、復号係数記憶部126に格納され、係数値復号部125によって参照される。また、復号の際に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
以下では、各部分領域R0〜R3に対応するコンテキスト導出について具体的に説明する。
(係数有無フラグ復号部124−Bの備える低周波位置コンテキスト導出部124b)
係数有無フラグ復号部124−Bの備える低周波位置コンテキスト導出部124bは、復号対象の周波数成分が、低周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出する。
係数有無フラグ復号部124−Bの備える低周波位置コンテキスト導出部124bは、部分領域R0に属する周波数成分に対して、以下の式(eq.B3)を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+2×uiPosX + uiPosY ・・・(eq.B3)
なお、NXはコンテキストインデックスの開始点を表す定数である。周波数領域のサイズが4×4及び8×8で用いるコンテキスト数が各々N4個、N8個の場合には、周波数領域のサイズが16×16および32×32の開始点はNX=N4+N8になる。
(係数有無フラグ復号部124−Bの備える周辺参照コンテキスト導出部124c)
係数有無フラグ復号部124−Bの備える周辺参照コンテキスト導出部124cは、復号対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について復号済みの非0変換係数の数cntに基づいて導出する。
係数有無フラグ復号部124−Bの備える周辺参照コンテキスト導出部124cは、部分領域R1に属する周波数成分に対して、以下の式(eq.B4)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+3+min(4、cnt) ・・・(eq.B4)
なお、部分領域R1において、非0変換係数のカウント数cntは、図10(a)または図10(b)に示す(C1、C2、C3、C4、C5)を用いて、以下の式(eq.B5)によって導出する。
cnt=(c1!=0)+(c2!=0)+(c3!=0)+(c4!=0)+(c5!=0) ・・・(eq.B5)
また、係数有無フラグ復号部124−Bの備える周辺参照コンテキスト導出部124cは、部分領域R2に属する周波数成分に対して、以下の式(eq.B6)を用いてコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+8+min(4、cnt) ・・・(eq.B6)
なお、部分領域R2において、非ゼロ変換係数のカウント数cntは、図36(a)に示す参照周波数成分(c1、c2、c4、c5)を用いて、対象とする変換係数の位置の、処理順で直前(処理順が逆スキャン順である場合には、対象とする変換係数の位置の下側)に位置する座標(c3)の変換係数を参照しないようにした以下の式(eq.B7)によって導出する。このような処理は、ある位置の係数有無フラグの復号に用いるコンテキスト導出を、直前の係数有無フラグの値を参照せずに行うことができるため、コンテキスト導出処理と復号処理とを並列に処理することができる。
cnt=(c1!=0)+(c2!=0)+(c4!=0)+(c5!=0)・・・(eq.B7)
ここで、式(eq.B7)の各項は、()内の比較が真である場合に1をとり、()内の比較が偽である場合に0をとるものとする。
また、部分領域R1に関して、式(eq.B6)の代わりに、式(eq.B7)によって非ゼロ係数の個数cntを算出してもよい。
また、部分領域R2に関して、式(eq.B7)の代わりに、図15(c)、(d)、(e)、(f)、または、図36(b)、図36(c)に示す3つの参照係数を用いて非ゼロ係数の個数cntを算出してもよい。
(係数有無フラグ復号部124−Bの備える高周波位置コンテキスト導出部124d)
係数有無フラグ復号部124−Bの備える高周波位置コンテキスト導出部124dは、復号対象の周波数成分が、高周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置と、当該周波数成分の属するサブブロックの位置に基づいて導出する。
係数有無フラグ復号部124−Bの備える高周波位置コンテキスト導出部124dは、部分領域R3に属する周波数成分に対して、以下の式(eq.B8)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+13+min(maxR3、(xCG+yCG−THB)>>shift) ・・・(eq.B8)
ここで、記号「>>」は、右ビットシフトを表している。また、shift及びmaxR3としては、例えば、対象周波数領域のサイズが16×16の場合は、shift=0、maxR3=3を用い、対象周波数領域のサイズが32×32の場合は、shift=1、maxR3=3を用いればよいが本実施形態はこれに限定されるものではない。
なお、係数有無フラグ復号部124−Bの備える周波数分類部124aによる分類処理によって分割される周波数領域の例は、図38に示すものに限定されるものではなく、例えば、図39に示すように周波数領域を分割してもよい。すなわち、係数有無フラグ復号部124−Bの備える周波数分類部124aは、次のように周波数領域を部分領域R0、R1、R2及びR3に分類する構成としてもよい。
(1)xCG+yCG<THA、かつ、uiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)xCG+yCG<THA、かつ、uiPosX+uiPosY≧THZ、を満たす周波数成分を部分領域R1に分類する。
(3)THA≦xCG+yCG<THBを満たす周波数成分を部分領域R2に分類する。
(4)THB≦xCG+yCGを満たす周波数成分を部分領域R3に分類する。
上記の分類処理に対応する疑似コードは次の通りである。
*******************************************************************
if( xCG+yCG<THA ){
if( uiPosX+uiPosY<THZ ){
R0へ分類
}
else {// if(uiPosX+uiPosY>THZ)
R1へ分類
}
}
else if( xCG+yCG<THB ){
R2へ分類
}
else{ // if( xCG+yCG>=THB)
R3へ分類
}
*******************************************************************
ここで、閾値THZには2を用いる。また、THA及びTHBの具体的な値としては、例えば、周波数領域のサイズ(処理対象TUのサイズ)log2TrafoSizeを用いて、
THA=1<<(log2TrafoSize-4)、
THB=1<<(log2TrafoSize-2)
とすればよい。また、周波数領域のサイズが16×16である場合、THA=1、THB=4とし、周波数領域のサイズが32×32である場合、THA=2、THB=8としてもよい。また、閾値THBは、周波数領域のサイズlog2TrafoSizeを用いて、
THB=1<<(log2TrafoSize-3)
と設定してもよい。すなわち、周波数領域のサイズが16×16である場合、THB=2とし、周波数領域のサイズが32×32である場合、THB=4と設定する。このように、周波数領域のサイズに応じて、異なる閾値を用いる構成としてもよい。
図39に示す例においては、周波数領域は、部分領域R0、R1、R2及びR3に分類される。部分領域R0、R1、R2及びR3に属する周波数成分に対しては、上述したように、それぞれ、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、及び高周波位置コンテキスト導出部124dによってコンテキストインデックスctxIdxが算出される。
以上のように構成された周波数分類部124aによれば、変換係数の位置によりコンテキスト導出方法を切り替えるための分岐を、サブブロック座標(xCG、yCG)を用いた分岐にすることにできる。(uiPosX、uiPosY)を参照する分岐処理を行う場合に比べ、サブブロック内部で行われる(uiPosX、uiPosY)を参照する分岐処理を省略することができ、コンテキスト導出のスループットを向上させることができる。
さらに、以上のように構成された係数有無フラグ復号部およびサブブロック係数有無フラグ復号部によれば、位置コンテキストの算出において、ある変換係数の位置の係数有無フラグのコンテキストを、既に復号された係数有無フラグの値によらずに決定するため、係数有無フラグのコンテキスト導出と、係数有無フラグの復号を並列で行うことができるという効果がある。
以下では、係数有無フラグ復号部の第8の構成例において、変換ブロックサイズが16×16、32×32のときに、周波数領域を部分領域R0、R1、R2、R3へ分割し、R0では低周波位置コンテキスト、R1〜R2では、図36(a)に示す4つの参照周波数成分(c1、c2、c4、c5)による周辺参照コンテキスト、R3では高周波位置コンテキストによりコンテキストインデックスctxIdxを導出する場合の疑似コードを示す。なお、疑似コード中のsigCtxは、ctxIdxと同義である。
*******************************************************************
If log2TrafoSize is less than or equal to 3, sigCtx is derived as follows.
shift = log2TrafoSize = = 3 ? 1 : 0
sigCtx = ( shift * 15 ) + ( ( yC >> shift ) << 2 ) + ( xC >> shift )
If cIdx is equal to 0 and log2TrafoSize is larger than 3, sigCtx is derived as follows
If xC + yC is less than 1, sigCtx is derived as follows.
sigCtx = 31
Otherwise if (xC>>2) + (yC>>2) is less than 1 << (uiLog2BlkSize-4), sigCtx is derived as follows.
temp = significant_coeff_flag[ xC + 1 ][ yC ] + significant_coeff_flag[ xC + 2 ][ yC ] + significant_coeff_flag[ xC + 1 ][ yC + 1 ] + significant_coeff_flag[ xC ][ yC + 2 ] temp = ( temp + 1) >>1 sigCtx = 32 + Min( 2, temp )
Otherwise if (xC>>2) + (yC>>2) is less than 1 << (uiLog2BlkSize-2), sigCtx is derived as follows.
temp = significant_coeff_flag[ xC + 1 ][ yC ] + significant_coeff_flag[ xC + 2 ][ yC ] + significant_coeff_flag[ xC ][ yC + 1 ] + significant_coeff_flag[ xC + 1 ][ yC + 1 ] + significant_coeff_flag[ xC ][ yC + 2 ]
temp = ( temp + 1) >>1 sigCtx = 35 + Min( 2, temp )
Otherwise (xC>>2) + (yC>>2) is greater than or equal to 1 << (uiLog2BlkSize-2), sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flag as follows.
sigCtx = 38
If cIdx is greater than 0 and log2TrafoSize is larger than 3, sigCtx is derived as follows
If xC + yC is less than 1, sigCtx is derived as follows.
sigCtx = 31
Otherwise if(xC>>2)+(yC>>2)is less than 1 << (uiLog2BlkSize-3), sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flagas follows.
temp = significant_coeff_flag[ xC + 1 ][ yC ] + significant_coeff_flag[ xC + 2 ][ yC ] + significant_coeff_flag[ xC + 1 ][ yC + 1 ] + significant_coeff_flag[ xC ][ yC + 2 ]
temp = ( temp + 1) >>1 sigCtx = 35 + Min( 2, temp )
Otherwise if((xC>>2)+ (yC>>2) is greater than or equal to 1 << (uiLog2BlkSize-3))) sigCtx is derived using previously decoded bins of the syntax element significant_coeff_flag as follows.
sigCtx = 38
*******************************************************************
<係数有無フラグ復号部の第8の構成例の他の構成例>
以下では、係数有無フラグ復号部124−Bによる他の処理例について図48、図52〜図53を参照して説明する。
図48(a)〜(b)は、本処理例において、周波数分類部124aによって分割された部分領域を示す図であり、図48(a)は、輝度値に関する変換係数を復号する際に好適に適用されるものであり、図48(b)は、色差に関する変換係数を復号する際に好適に適用されるものである。図48(a)〜(b)における閾値TH、閾値TH2の設定方法は既に説明した通りである。
閾値THを用いて、周波数分類部124aは、図52に示すように、対象変換係数の周波数成分上の位置(xC、yC)に応じて部分領域R1と部分領域R2を分類する。
xC+yC < TH
閾値TH2を用いて、周波数分類部124aは、図52に示すように、対象変換係数の周波数成分上の位置(xC、yC)をあるサブブロックサイズ(ここでは4)で割った値に応じて、互いに参照数の異なる部分領域R2と部分領域R3を分類する。
(xC>>2)+(yC>>2) < TH2
ここで2つの部分領域を区別する閾値TH2は、既に説明した通りTH2×サブブロックサイズ(=4)が、対象周波数領域のサイズMax(width、height)よりも小さいことを満たすことが好ましい。
図52は、図48(a)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスであって、輝度に関するコンテキストインデックスcxtIdxを導出する導出処理を示す擬似コードである。図52において、領域R0のコンテキスト導出は、位置コンテキスト導出部124bによって行われ、領域R1〜領域R2のコンテキスト導出は、周辺参照コンテキスト導出部124c、領域R3のコンテキスト導出は、高周波位置コンテキスト導出部124dによって行われる。
周辺参照コンテキスト導出部124cは、例えば、図48(a)、(b)に示す部分領域R1に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtxを周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR1 + Min(2, ctxCnt);
ここで、ctxcCntは、カウント数に応じて得られる値である。ここでは、カウント数を多対一変換する処理(集約処理)により集約して得る。すなわち、以下の式のように、約1/2にするように右シフトして得られる値であり
ctxCnt=(cnt+1)>>1
によって定まる。また、右シフトによらず、以下のようにカウント数を固定値(ここでは3)にクリップする処理により多対一変換を行っても良い。
ctxCnt=min(3、cnt)
なお、非0変換係数のカウント数cntは、次の擬似コードのように、対象変換係数の周波数成分上の位置(xC、yC)に応じて、c1、c2、c3、c4、c5の5つの既に復号済みの変換係数を参照するか、もしくは、c1、c2、c4、c5の4つの既に復号済みの変換係数を参照することで算出する。
if( ( ( xC & 3 ) || ( yC & 3 ) ) && ( ( (xC+1) & 3 ) || ( (yC+2) & 3 ) )
))
{
cnt = (c1!=0) + (c2!=0) + (c4!=0) + (c5!=0);
} else{
cnt= (c1!=0) + (c2!=0) + (c3!=0) + (c4!=0) + (c5!=0);
}
また、周辺参照コンテキスト導出部124cは、例えば、図48(a)に示す部分領域R2に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtxを周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR2 + Min(2, ctxCnt);
なお、非0変換係数のカウント数cntの計算方法は、部分領域R1と同様である。
高周波位置コンテキスト導出部124dは、例えば、図48に示す部分領域R3に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtx を周波数分類部124aに供給する。すなわち、固定値を用いてコンテキストインデックスを導出する。
sigCtx = sigCtxOffsetR3;
高周波数成分である部分領域R3では、低周波数成分の部分領域R1、R2と異なり位置コンテキストによりコンテキストを導出するため、処理量が削減される。
色差の場合も、図48(b)の部分領域R0、部分領域R1、部分領域R3について、輝度の場合と同様の処理を行う。まず、周波数分類部124aは、図53に示すように、対象変換係数の周波数成分上の位置(xC、yC)をあるサブブロックサイズ(ここでは4)で割った値に応じて、互いに参照数の異なる部分領域R1と部分領域R3を分類する。さら、図53に示す通り、部分領域R0では位置コンテキスト導出部124bにおいて位置コンテキストによりコンテキスト導出を行い、部分領域R1では周辺参照コンテキスト導出部124cにおいて、周辺参照コンテキストによるコンテキスト導出を行う。部分領域R3では、位置コンテキストによりコンテキスト導出を行うことにより、処理量を削減する。
なお、上記の構成は、以下のように表現することもできる。
分割手段(周波数分類部124a)は、対象周波数領域を少なくとも低周波数側と高周波数側の2つの部分領域に分割するものであり、上記コンテキストインデックス導出手段は、低周波数側に属する部分領域の少なくとも1つでは、復号済みの非0変換係数を参照することによって、コンテキストインデックスを導出し、高周波数側に属する部分領域では、周波数領域上の位置に基づく値、または固定的な所定の値をコンテキストインデックスとして導出する。
(周囲参照コンテキストと位置コンテキストのコンテキスト共有)
なお、高周波位置コンテキスト導出部124dにおいて、周囲参照コンテキスト導出部124cで用いるコンテキストを用いることもできる。すなわち、周囲参照コンテキストを用いる部分領域と、位置コンテキストを用いる高周波領域の部分領域とでコンテキストを共有することができる。このような構成について図54〜図56を用いて具体例を説明する。
図54も、図52と同様、輝度に関するコンテキストインデックスcxtIdxを導出する導出処理を示す擬似コードである。図52とは高周波位置コンテキスト導出部124dの処理のみが異なる。図52に示す処理では、以下の式により、コンテキストインデックスsigCtxを導出する。
sigCtx = sigCtxOffsetR2;
すなわち、周辺参照コンテキスト導出部124cにおいてオフセット値ctxCnt = 0として求められる部分領域R2で用いるコンテキストを、高周波位置コンテキスト導出部124dの導出する部分領域R3のコンテキストとしても用いる。なお、2つの処理を統一するために、部分領域R3では以下の式で、コンテキストインデックスを導出しても良い。
ctxCnt = 0;
sigCtx = sigCtxOffsetR2 + Min(2, ctxCnt);
この場合、部分領域R2では、オフセット値ctxCntをカウント値cntから求め、部分領域R3では、オフセット値ctxCntを0固定で求める。
色差に対しても上記と同様にコンテキスト共有を行うことができる。具体的には、図55は、コンテキスト共有する場合の、色差に関するコンテキストインデックスcxtIdx導出処理を示す擬似コードである。コンテキストを共有しない図53とは高周波位置コンテキスト導出部124dの処理のみが異なる。
このように、周囲参照コンテキストを用いる部分領域と、位置コンテキストを用いる高周波領域の部分領域とでコンテキストを共有することができる。これは、コンテキストインデックス導出手段(高周波位置コンテキスト導出部124d、周囲参照コンテキスト導出部124c)により導出される、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲内であると表現することもできる。
なお、色差の場合に高周波の位置コンテキストと周囲参照コンテキストの共有を行う構成(図55)を用い、輝度の場合には高周波の位置コンテキストと周囲参照コンテキストの共有を行わない構成(図52)を用いることも可能である。具体的には、図56に示すように輝度の場合には、以下の式により部分領域R3のコンテキストインデックスを求める。
sigCtx = sigCtxOffsetR3 + ctxCnt;
但しctxCnt = 0。
色差の場合には、以下の式により部分領域R3のコンテキストインデックスを求める。
sigCtx = sigCtxOffsetR1 + ctxCnt;
但しctxCnt = 0である。
これにより輝度の場合には、部分領域R3専用のコンテキストが用いられ、色差の場合には、部分領域R3以外の部分領域、ここでは周囲参照コンテキストを用いる部分領域1のコンテキストが用いられる。
以上の構成のように、2つの異なる導出方法(位置コンテキストと周辺参照コンテキスト)で同じコンテキストの共有を行うことで、コンテキストに伴うメモリを低減することができる。
また、上記コンテキスト共有において、オフセット値ctxCnt=0の周辺参照コンテキストと位置コンテキストを共有する方法の他、以下の式のようにオフセット値ctxCntが0以外のコンテキストと位置コンテキストを共有しても良い。
ctxCnt = 1
sigCtx = sigCtxOffsetR1 + ctxCnt;
上記の構成は、コンテキストインデックス導出手段(高周波位置コンテキスト導出部124d、周囲参照コンテキスト導出部124c)により導出される、輝度に関するコンテキストインデックスであって、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲以外の値であり、上記コンテキストインデックス導出手段により導出される、色差に関するコンテキストインデックスであって、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲内である、と表現することもできる。
<係数有無フラグ復号部の第8の構成例のコンテキスト更新遅延除去を考慮した構成例>
以下では、係数有無フラグ復号部124−Bによるコンテキスト更新遅延除去を考慮した処理例について図48、図52〜図53を参照して説明する。
位置コンテキストを用いる場合には、これまで説明した通り、ある位置の係数有無フラグの復号に用いるコンテキスト導出を、直前の係数有無フラグの値を参照せずに行うことができるため、コンテキスト導出処理と復号処理とを並列に処理することができる。
しかしながら、復号処理において同一のコンテキストを用いる場合には、直前のコンテキストの復号結果が0であるか1であるかに応じてコンテキストの有する状態のアップデートが必要となるので、このアップデート分の遅延が発生する。以下は、位置コンテキストにおいて、直前のコンテキストとは異なるコンテキストを割り当てることによって、コンテキストの状態アップデートに伴う遅延を削減する効果を奏する係数有無フラグ復号部の構成例を示す。
図57は、サブブロック内におけるコンテキストインデックスの導出方法を示す図である。図57(a)は、サブブロックのスキャン順と、サブブロック内でのコンテキストインデックスのオフセット値ctxCntとの関係を示す図である。図に示す通り、スキャン順毎にオフセット値ctxCntは0、1、0、1というのように交互に異なる値を用いる。このようなオフセット値を用いることにより、直前のコンテキストと異なるコンテキストを割り当てることが可能になる。図57(b)は、上記処理に用いるテーブルの例を示す。図57(b)に示すテーブルは、サブブロック内の相対位置をラスタスキャンにおけるアドレスとして入力することにより、オフセット値ctxCntを得るテーブルである。
図57(c)では使用例を示す。当該使用例においては、周波数成分の位置(xC、yC)から、
(xC & 3) + (yC & 3 << 2)
の演算により、ラスタスキャン上のアドレスを得た後、図57(b)に示すテーブルを参照することによって、オフセット値ctxCntを得る。なお、オフセット値ctxCntの算出は、テーブルを用いることなくサブブロック内のカウンタcntInSubBlockを用いることで通常の演算で算出することができる。図57(d)は、この演算の例である。カウンタcntInSubBlockは、サブブロックのスキャン順に0、1、2、3、・・・、15の値をとるものとする。この場合、カウンタcntInSubBlockと2の剰余(&1)によって、オフセット値ctxCntを算出することができる。なお、カウントcntInSubBlockの値は逆スキャン順に0、1、2、3、・・・、15の値をとっても良い。
図58は、図57の例よりさらに並列度を増すことのできる構成である。図58(a)は、サブブロックのスキャン順と、サブブロック内でのコンテキストインデックスのオフセット値ctxCntの関係を示す図である。図に示す通り、スキャン順毎にオフセット値ctxCntは0、1、2、0、1、2、・・・というのようにN個単位(N=3)で異なる値を用いる。このようなオフセット値を用いることにより、N個の連続するコンテキストで異なるコンテキストを割り当てることが可能になる。直前だけではなく、直前の直前(もしくはそれ以上)の復号で独立性が保たれるため、並列性をさらに増すことができる。図58(b)は、上記処理に用いるテーブルの例、図58(c)は使用例、図58(d)は演算による算出方法例を示している。これらは全て図57と同様の処理であるので説明を省略する。なお、N=3の場合を示したが、N=4以上のNについても同様の処理が可能である。
図59は、上記コンテキストの割り当て方法を実現する擬似コードを示す図である。具体的には、図48(a)に示す部分領域R0〜R3のそれぞれに含まれる周波数領域に割り付けるコンテキストインデックスであって、輝度および色差に関するコンテキストインデックスcxtIdxを導出する導出処理を示す。図59において、領域R0のコンテキスト導出は、位置コンテキスト導出部124bによって行われ、領域R1〜領域R2のコンテキスト導出は、周辺参照コンテキスト導出部124c、領域R3のコンテキスト導出は、高周波位置コンテキスト導出部124dによって行われる。
周辺参照コンテキスト導出部124cは、例えば、図48(a)、(b)に示す部分領域R1に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtxを周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR1 + Min(2, ctxCnt);
ここで、ctxcCntは、多対一変換する処理(集約処理)、ここでは以下の式のようにカウント数を約1/2にするように右シフトする処理によって得る。
ctxCnt=(cnt+1)>>1
なお、多対一変換する処理は、以下のようにカウント数を固定値(ここでは3)にクリップする処理でも良い。
ctxCnt=min(3、cnt)
なお、非0変換係数のカウント数cntは、次の擬似コードのように、対象変換係数の周波数成分上の位置(xC、yC)に応じて、c1、c2、c3、c4、c5の5つの既に復号済みの変換係数を参照するか、もしくは、c1、c2、c4、c5の4つの既に復号済みの変換係数を参照することで算出する。
if( ( ( xC & 3 ) || ( yC & 3 ) ) && ( ( (xC+1) & 3 ) || ( (yC+2) & 3 ) )
))
{
cnt = (c1!=0) + (c2!=0) + (c4!=0) + (c5!=0);
} else{
cnt= (c1!=0) + (c2!=0) + (c3!=0) + (c4!=0) + (c5!=0);
}
また、周辺参照コンテキスト導出部124cは、例えば、図48(a)に示す部分領域R2に属する周波数成分に対して、以下の式を用いてコンテキストインデックスsigCtxを導出し、その導出結果sigCtxを周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR2 + Min(2, ctxCnt);
なお、非0変換係数のカウント数cntの計算方法は、部分領域R1と同様である。
高周波位置コンテキスト導出部124dは、例えば、図48に示す部分領域R3に属する周波数成分に対して、以下の式を用いてオフセット値を算出する。
ctxCnt = tbl[(xC & 3) + (yC & 3)<<2]
このオフセット値と、部分領域R3用のコンテキストインデックスの開始点sigCtxOffsetR3との和により、以下の式によって、コンテキストインデックスsigCtxを導出し、その導出結果sigCtx を周波数分類部124aに供給する。
sigCtx = sigCtxOffsetR3 + ctxCnt
高周波数成分である部分領域R3では、位置コンテキストによりコンテキストを導出するため処理量を削減と、コンテキスト導出処理と復号処理と、コンテキストの保持する状態のアップデートに伴う遅延削除によるスループット向上効果を得ることができる。
なお、本構成では、高周波数成分の部分領域R3に対する構成を示すが、コンテキストの保持する状態のアップデートに伴う遅延削除によるスループット向上効果は、ブロックおよびサブブロック内で連続する周波数位置において異なるオフセット値ctxIdxを算出し、このオフセット値ctxIdxとある開始点との和から、コンテキストインデックスsigCtxを算出する他の構成においても利用することができる。
なお、コンテキスト更新遅延除去を考慮する場合においても、高周波位置コンテキスト導出部124dにおいて、周囲参照コンテキスト導出部124cで用いるコンテキストを用いることもできる。すなわち、周囲参照コンテキストを用いる部分領域と、位置コンテキストを用いる高周波領域の部分領域とでコンテキストを共有する構成とすることができる。このような構成について、図60を用いて具体例を説明する。
図59と図60の処理では、高周波位置コンテキスト導出部124dの処理のみが異なるオフセット値ctxCntを導出した後において、輝度の場合には、以下の式でコンテキストインデックスsigCtxを導出する。
sigCtx = sigCtxOffsetR2 + ctxCnt
色差の場合には以下の式でコンテキストインデックスsigCtxを導出する。
sigCtx = sigCtxOffsetR1 + ctxCnt
上記処理によって、コンテキスト共有によりコンテキスト用のメモリを低減しながら、位置コンテキストによりコンテキストを導出するため処理量の削減と、コンテキスト導出処理と復号処理と、コンテキストの保持する状態のアップデートとに伴う遅延削除によるスループット向上効果を得ることができる。
<係数有無フラグ復号部の第9の構成例>
本実施形態に係る係数有無フラグ復号部の第9の構成例について、図40を参照して説明する。本構成例は、第4の構成例に係る周波数分類部124aにおいて、周波数領域を部分領域R0〜R5へ分類する際の条件を変更したものである。なお、上記第7〜第8の構成例で示した部材と同一の機能を有する部材には、同一の符号を付し、その説明を省略する。
図40は、本構成例に係る係数有無フラグ復号部124−Cの構成を示すブロック図である。図40に示すように、本構成例に係る係数有無フラグ復号部124−Cは、サブブロック係数有無フラグ復号部X1、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、および高周波位置コンテキスト導出部124dを備えている。また、係数有無フラグ復号部124−Cにおける復号処理の流れは、図33を用いて説明される。
(係数有無フラグ復号部124−Cの備えるサブブロック係数有無フラグ復号部X1)
係数有無フラグ復号部124−Cの備えるサブブロック係数有無フラグ復号部X1は、ビット復号部132より供給されるBinを解釈し、周波数領域を構成する各サブブロックの中に少なくとも1つ非0の変換係数が存在するか否かを示すサブブロック係数有無フラグ(siginificant_coeffgroup_flag)を復号する(図33のステップSY1)。
続いて、変換ブロック内にあるサブブロック毎に、サブブロック内にある変換係数有無フラグを復号する(図33のステップSY2〜ステップSY4)。すなわち、サブブロック係数有無フラグ復号部X1おいて、サブブロック係数有無フラグが1の場合(図33のステップSY2においてYの場合)、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、及び高周波数位置コンテキスト導出部124dを用いてサブブロック内の係数有無フラグを復号する。また、サブブロック係数有無フラグが0の場合(図33のステップSY2においてNの場合)、サブブロック内の係数有無フラグの復号をスキップし、次のサブブロックの処理へ移行する。
(係数有無フラグ復号部124−Cの備える周波数分類部124a)
係数有無フラグ復号部124−Cの備える周波数分類部124aは、周波数領域における復号対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、及び高周波数位置コンテキスト導出部124dの何れかによって導出されたコンテキストインデックスctxIdxを、当該復号対象の周波数成分に割り付ける(図33のステップSY3)。
係数有無フラグ復号部124−Cの備える周波数分類部124aは、周波数領域に含まれる各周波数成分の当該周波数領域における位置(uiPosX、uiPosY)を参照し、当該周波数成分を5つの部分領域R0〜R4に分類する。ここで、uiPosX=0、1、...、sz−1であり、uiPosY=0、1、...、sz−1であるとする(szは、上述のように処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表しており、例えば、sz=16,32等である)。
ここで、sz×szブロックの周波数領域を4×4サブブロックに分割し、当該周波数成分(uiPosX、uiPosY)が属するサブブロックの位置を(xCG,yCG)とする。なお、当該周波数成分の属するサブブロック位置(xCG,yCG)は下記式(eq.C1)〜(eq.C2)により導出される。
xCG=uiPosX>>2 ・・・(eq.C1)
yCG=uiPosY>>2 ・・・(eq.C2)
ここで、xCG=0、1、...、(sz−1)>>2であり、yCG=0、1、...、(sz−1)>>2であるとする。
係数有無フラグ復号部124−Cの備える周波数分類部124aは、より具体的には、以下の分類処理を行う。
(1)xCG+yCG<THC、かつ、uiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)xCG+yCG<THC、かつ、THZ≦uiPosX+uiPosY<TH1を満たす周波数成分を部分領域R1に分類する。
(3)xCG+yCG<THC、かつ、TH1≦uiPosX+uiPosYを満たす周波数成分を部分領域R2に分類する。
(4)THC≦xCG+yCG<THDを満たす周波数成分を部分領域R3に分類する。
(5)THD≦xCG+yCGを満たす周波数成分を部分領域R4に分類する。
上記分類処理に対応する疑似コードは次の通りである。
*******************************************************************
if( xCG+yCG<THC ){
if( uiPosX+uiPosY<THZ ){
R0へ分類
}
else if( uiPosX+uiPosY<TH1){
R1へ分類
}
else { //if(uiPosX+uiPosY>=TH1)
R2へ分類
}
}
else if( xCG+yCG<THD ){
R3へ分類
}
else { // if(xCG+yCG>=THD
R4へ分類
}
*******************************************************************
ここで、閾値THZは2を用いる。また、閾値TH1=5である。また、閾値THC、及びTHDの具体的な値としては、例えば、周波数領域のサイズlog2TrafoSizeを用いて、次のように設定すればよい。
THC=1<<(log2TrafoSize−2)、
THD=1<<(log2TrafoSize−2)+2
すなわち、周波数領域のサイズが16×16である場合、THC=4、THD=6とし、周波数領域のサイズが32×32である場合、THC=8、THD=10と設定する。このように、周波数領域のサイズに応じて、異なる閾値を用いる構成としてもよい。
図41は、係数有無フラグ復号部124−Cの備える周波数分類部124aによる分類処理によって、部分領域R0、R1、R2、R3、及びR4に分割された周波数領域の一例を示している。
係数有無フラグ復号部124−Cの備える周波数分類部124aは、部分領域R0に属する周波数成分に対して、低周波位置コンテキスト導出部124bによって導出されたコンテキストインデックスを割り付け、部分領域R1、R2及びR3に属する周波数成分に対して、周辺参照コンテキスト導出部124cによって導出されたコンテキストインデックスを割り付け、部分領域R3に属する周波数成分に対して、高周波数位置コンテキスト導出部124dによって導出されたコンテキストインデックスを割り付ける。
また、係数有無フラグ復号部124−Cの備える周波数分類部124aは、算術符号復号部130でシンタックスsignificant_coeff_flagを復号するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズおよび復号対象の周波数成分毎に算出される(図33のステップSY4)。復号されたシンタックスsignificant_coeff_flagは、復号係数記憶部126に格納され、係数値復号部125によって参照される。また、復号の際に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
以下では、各部分領域R0〜R4に対応するコンテキスト導出について具体的に説明する。
(係数有無フラグ復号部124−Cの備える低周波位置コンテキスト導出部124b)
係数有無フラグ復号部124−Cの備える低周波位置コンテキスト導出部124bは、復号対象の周波数成分が、低周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出する。
係数有無フラグ復号部124−Cの備える低周波位置コンテキスト導出部124bは、部分領域R0に属する周波数成分に対して、以下の式(eq.C3)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+2×uiPosX + uiPosY ・・・(eq.C3)
なお、NXはコンテキストインデックスの開始点を表す定数である。周波数領域のサイズが4×4及び8×8で用いるコンテキスト数が各々N4個、N8個の場合には、周波数領域のサイズが16×16および32×32の開始点はNX=N4+N8になる。
(係数有無フラグ復号部124−Cの備える周辺参照コンテキスト導出部124c)
係数有無フラグ復号部124−Cの備える周辺参照コンテキスト導出部124cは、復号対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について復号済みの非0変換係数の数cntに基づいて導出する。
係数有無フラグ復号部124−Cの備える周辺参照コンテキスト導出部124cは、部分領域R1に属する周波数成分に対して式(eq.C4)を用い、部分領域R2に属する周波数成分に対して式(eq.C5)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+3+min(2、temp) ・・・(eq.C4)
temp=(cnt+1)>>1
ctxIdx=NX+6+min(2、temp) ・・・(eq.C5)
temp=(cnt+1)>>1
なお、部分領域R1、及びR2において、非0変換係数のカウント数cntは、図10(a)または図10(b)に示す(C1、C2、C3、C4、C5)を用いて、以下の式(eq.C6)によって導出する。
cnt=(c1!=0)+(c2!=0)+(c3!=0)+(c4!=0)+(c5!=0) ・・・(eq.C6)
あるいは、図36(a)に示す参照周波数成分(c1、c2、c4、c5)を用いて、対象とする変換係数の位置の、処理順で直前(処理順が逆スキャン順である場合には、対象とする変換係数の位置の下側)に位置する座標(c3)の変換係数を参照しないようにした以下の式(eq.C7)によって導出してもよい。このような処理は、ある位置の係数有無フラグの復号に用いるコンテキスト導出を、直前の係数有無フラグの値を参照せずに行うことができるため、コンテキスト導出処理と復号処理とを並列に処理することができる。
cnt=(c1!=0)+(c2!=0)+(c4!=0)+(c5!=0) ・・・(eq.C7)
また、本構成例に係る辺参照コンテキスト導出部124cは、部分領域R3に属する周波数成分に対して、以下の式(eq.C8)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+9+min(2、temp) ・・・(eq.C8)
temp=(cnt+1)>>1
また、部分領域R3において、非ゼロ変換係数のカウント数cntは、図15(i)に示す3つの参照周波数成分(c1、c3、c4)を用いて、以下の式(eq.C9)によって導出する。
cnt=(c1!=0)+(c3!=0)+(c4!=0) ・・・(eq.C9)
ここで、各項は、()内の比較が真である場合に1をとり、()内の比較が偽である場合に0をとるものとする。
また、参照周波数成分は、図15(i)に示すc1、c3、c4に限定されず、図15(c)、(d)、(e)、(f)にそれぞれ示す3つの参照周波数成分を用いてもよい。
なお、部分領域R3のコンテキストインデックスctxIdxの導出として、式(eq.C8)に限定されず、式(eq.C10)のようにしてもよい。
ctxIdx=NX+9+min(2、cnt) ・・・(eq.C10)
(係数有無フラグ復号部124−Cの備える高周波位置コンテキスト導出部124d)
係数有無フラグ復号部124−Cの備える高周波位置コンテキスト導出部124dは、復号対象の周波数成分が、高周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出する。
係数有無フラグ復号部124−Cの備える高周波位置コンテキスト導出部124dは、部分領域R4に属する周波数成分に対して、以下の式(eq.C11)を用いてコンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部124aに供給する。
ctxIdx=NX+11+min(maxR3、(xCG+yCG−THD)>>shift) ・・・(eq.C11)
ここで、shift及びmaxR3としては、例えば、対象周波数領域のサイズが16×16の場合は、shift=0、maxR3=3を用い、対象周波数領域のサイズが32×32の場合は、shift=1、maxR3=3を用いればよいが、本実施形態はこれに限定されるものではない。
なお、係数有無フラグ復号部124−Cの備える周波数分類部124aによる分類処理によって、分割される周波数領域の例は、図41に示すものに限定されるものではなく、例えば、図42に示すように周波数領域を分割してもよい。すなわち、周波数分類部124aは、次のように周波数領域を部分領域R0、R1、R2、R3、及びR4に分類する構成としてもよい。
(1)xCG+yCG<THE、かつ、uiPosX+uiPosY<THZを満たす周波数成分を部分領域R0に分類する。
(2)xCG+yCG<THE、かつ、THZ≦uiPosX+uiPosY、を満たす周波数成分を部分領域R1に分類する。
(3)THE≦xCG+yCG<THFを満たす周波数成分を部分領域R2に分類する。
(4)THF≦xCG+yCG<THGを満たす周波数成分を部分領域R3に分類する。
(5)THG≦xCG+yCGを満たす周波数成分を部分領域R4に分類する。
上記分類処理に対応する疑似コードは次の通りである。
*******************************************************************
if( xCG+yCG<THE ){
if( uiPosX+uiPosY<THZ ){
R0へ分類
}
else{ // if( uiPosX+uiPosY>=THZ )
R1へ分類
}
}
else if( xCG+yCG<THF ){
R2へ分類
}
else if( xCG+yCG<THG ){
R3へ分類
}
else{ // xCG+yCG>=THG
R4へ分類
}
*******************************************************************
ここで、閾値THZは2を用いる。また、閾値THE、THF及びTHGの具体的な値としては、例えば、周波数領域のサイズ(処理対象TUのサイズ)log2TrafoSizeを用いて、
THE=1
THF=1<<(log2TrafoSize-2)
THG=1<<(log2TrafoSize-2)+2
と設定すればよい。すなわち、周波数領域のサイズが16×16である場合、THE=1、THF=2、THG=4とし、周波数領域のサイズが32×32である場合、THE=1、THF=4、THG=10としてもよい。このように、周波数領域のサイズに応じて、異なる閾値を用いる構成としてもよい。
以上のように、本構成例に係る係数有無フラグ復号部によれば、所定の閾値THFより高周波数側の部分領域(例えば、図41の部分領域R3)では、各変換係数有無フラグに割り付けるコンテキストインデックス導出において、参照する復号済みの非0変換係数の数が、低周波数側の部分領域(例えば、図41の部分領域R2)において参照する復号済みの非0変換係数の数よりも小さいため、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。さらに別の閾値THGより高周波数側の部分領域(例えば、図41の部分領域R4)においては、コンテキストインデックスを周囲参照によらず位置に基づいて導出するので、さらに処理量を削減することができる。また、位置参照は、コンテキストの導出に既に復号した係数有無フラグの値を用いないため、並列性も向上させることができる。
なお、上記の構成では、周波数分類部124aが5つの部分領域に分類を行っているが、3つの部分領域に分類する構成でも良い。例えば、
(1)uiPosX+uiPosY<THZ、かつ、xCG+yCG<THGを満たす周波数成分を部分領域R0に分類する。
(2)・THZ≦uiPosX+uiPosY、かつ、xCG+yCG<THGを満たす周波数成分を部分領域R1に分類する。
(3)THG≦xCG+yCGを満たす周波数成分を部分領域R4に分類する、としても良い。
上記分類処理に対応する疑似コードは次の通りである。
*******************************************************************
if ( xCG+yCG<THG ){
if( uiPosX+uiPosY<THZ ){
R0へ分類
}
else{ //if( uiPosX+uiPosY>=THZ)
R1へ分類
}
}
else {// if( xCG+yCG>=THG)
R4へ分類}
*******************************************************************
以上のように、本構成例に係る係数有無フラグ復号部124−Cにおいて、周波数分類部124aは、対象周波数領域を、処理対象の変換係数有無フラグの位置と、その変換係数有無フラグが属するサブブロックの位置に応じて、少なくとも3つの部分領域に分類するものであり、
周辺参照コンテキスト導出部124cは、
第1の部分領域(部分領域R1またはR2)では、復号済みの非0変換係数をN1個(N1は自然数)参照し、
第2の部分領域(部分領域R3)では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、
第3の部分領域(部分領域R4)では、高周波位置コンテキスト導出部124dが、変換係数有無フラグの属するサブブロックの位置に応じて、コンテキストインデックスを導出する。
上記の構成によれば、コンテキストインデックスを導出するために参照する復号済みの非0変換係数の数がより小さく設定された部分領域と、対象周波数領域における該変換係数有無フラグの位置と、該変換係数有無フラグの属するサブブロックの位置とに基づいてコンテキストインデックスを導出する部分領域とを組み合わせることによって、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
(動画像符号化装置2)
本実施形態に係る動画像符号化装置2の構成について図26〜図28を参照して説明する。動画像符号化装置2は、H.264/MPEG−4 AVC規格に採用されている技術、VCEG(Video Coding Expert Group)における共同開発用コーデックであるKTAソフトウェアに採用されている技術、TMuC(Test Model under Consideration)ソフトウェアに採用されている技術、および、その後継コーデックであるHEVC(High-Efficiency Video Coding)にて提案されている技術を実装している符号化装置である。以下では、既に説明した部分と同じ部分については同じ符号を付し、その説明を省略する。
図26は、動画像符号化装置2の構成を示すブロック図である。図26に示すように、動画像符号化装置2は、予測画像生成部21、変換・量子化部22、逆量子化・逆変換部23、加算器24、フレームメモリ25、ループフィルタ26、可変長符号符号化部27、および、減算器28を備えている。また、図26に示すように、予測画像生成部21は、イントラ予測画像生成部21a、動きベクトル検出部21b、インター予測画像生成部21c、予測方式制御部21d、および、動きベクトル冗長性削除部21eを備えている。動画像符号化装置2は、動画像#10(符号化対象画像)を符号化することによって、符号化データ#1を生成する装置である。
(予測画像生成部21)
予測画像生成部21は、処理対象LCUを、1または複数の下位CUに再帰的に分割し、各リーフCUをさらに1または複数のパーティションに分割し、パーティション毎に、画面間予測を用いたインター予測画像Pred_Inter、または、画面内予測を用いたイントラ予測画像Pred_Intraを生成する。生成されたインター予測画像Pred_Interおよびイントラ予測画像Pred_Intraは、予測画像Predとして、加算器24および減算器28に供給される。
なお、予測画像生成部21は、スキップモードの適応されたPUについては、当該PUに属する他のパラメータの符号化を省略する。また、(1)対象LCUにおける下位CUおよびパーティションへの分割の態様、(2)スキップモードを適用するか否か、および、(3)パーティション毎にインター予測画像Pred_Interおよびイントラ予測画像Pred_Intraの何れを生成するか、は、符号化効率を最適化するように決定される。
(イントラ予測画像生成部21a)
イントラ予測画像生成部21aは、画面内予測によって、各パーティションに関する予測画像Pred_Intraを生成する。具体的には、(1)各パーティションついてイントラ予測に用いる予測モードを選択し、(2)選択した予測モードを用いて、復号画像Pから予測画像Pred_Intraを生成する。イントラ予測画像生成部21aは、生成したイントラ予測画像Pred_Intraを、予測方式制御部21dに供給する。
また、イントラ予測画像生成部21aは、対象パーティションの周辺のパーティションに割り付けられた予測モードから対象パーティションに対する推定予測モードを決定し、当該推定予測モードと、対象パーティションについて実際に選択された予測モードとが同じであるか否かを示す推定予測モードフラグを、イントラ予測パラメータPP_Intraの一部として、予測方式制御部21dを介して可変長符号符号化部27に供給し、可変長符号符号化部27は、当該フラグを、符号化データ#1に含める構成とする。
また、イントラ予測画像生成部21aは、対象パーティションについての推定予測モードと、対象パーティションについて実際に選択された予測モードとが異なる場合には、対象パーティションについての予測モードを示す残余予測モードインデックスを、イントラ予測パラメータPP_Intraの一部として、予測方式制御部21dを介して可変長符号符号化部27に供給し、可変長符号符号化部27は当該残余予測モードインデックスを符号化データ#1に含める構成とする。
(動きベクトル検出部21b)
動きベクトル検出部21bは、各パーティションに関する動きベクトルmvを検出する。具体的には、(1)参照画像として利用する適応フィルタ済復号画像P_ALF’を選択し、(2)選択した適応フィルタ済復号画像P_ALF’において対象パーティションを最良近似する領域を探索することによって、対象パーティションに関する動きベクトルmvを検出する。ここで、適応フィルタ済復号画像P_ALF’は、既にフレーム全体の復号が完了した復号済みの復号画像に対して、ループフィルタ26による適応的フィルタ処理を施すことによって得られる画像であり、動きベクトル検出部21bは、適応フィルタ済復号画像P_ALF’を構成する各画素の画素値をフレームメモリ25から読み出すことができる。動きベクトル検出部21bは、検出した動きベクトルmvを、参照画像として利用した適応フィルタ済復号画像P_ALF’を指定する参照画像インデックスRIと共に、インター予測画像生成部21c及び動きベクトル冗長性削除部21eに供給する。
(インター予測画像生成部21c)
インター予測画像生成部21cは、画面間予測によって、各インター予測パーティションに関する動き補償画像mcを生成する。具体的には、動きベクトル検出部21bから供給された動きベクトルmvを用いて、動きベクトル検出部21bから供給された参照画像インデックスRIによって指定される適応フィルタ済復号画像P_ALF’から動き補償画像mcを生成する。動きベクトル検出部21bと同様に、インター予測画像生成部21cは、適応フィルタ済復号画像P_ALF’を構成する各画素の画素値をフレームメモリ25から読み出すことができる。インター予測画像生成部21cは、生成した動き補償画像mc(インター予測画像Pred_Inter)を、動きベクトル検出部21bから供給された参照画像インデックスRIと共に、予測方式制御部21dに供給する。
(予測方式制御部21d)
予測方式制御部21dは、イントラ予測画像Pred_Intra及びインター予測画像Pred_Interを符号化対象画像と比較し、イントラ予測を行うかインター予測を行うかを選択する。イントラ予測を選択した場合、予測方式制御部21dは、イントラ予測画像Pred_Intraを予測画像Predとして加算器24及び減算器28に供給すると共に、イントラ予測画像生成部21aから供給されるイントラ予測パラメータPP_Intraを可変長符号符号化部27に供給する。一方、インター予測を選択した場合、予測方式制御部21dは、インター予測画像Pred_Interを予測画像Predとして加算器24及び減算器28に供給すると共に、参照画像インデックスRI、並びに、後述する動きベクトル冗長性削除部21eから供給された推定動きベクトルインデックスPMVI及び動きベクトル残差MVDをインター予測パラメータPP_Interとして可変長符号符号化部27に供給する。また、予測方式制御部21dは、イントラ予測画像Pred_Intra及びインター予測画像Pred_Interのうち何れの予測画像を選択したのかを示す予測タイプ情報Pred_typeを可変長符号符号化部27に供給する。
(動きベクトル冗長性削除部21e)
動きベクトル冗長性削除部21eは、動きベクトル検出部21bによって検出された動きベクトルmvにおける冗長性を削除する。具体的には、(1)動きベクトルmvの推定に用いる推定方法を選択し、(2)選択した推定方法に従って推定動きベクトルpmvを導出し、(3)動きベクトルmvから推定動きベクトルpmvを減算することにより動きベクトル残差MVDを生成する。動きベクトル冗長性削除部21eは、生成した動きベクトル残差MVDを、選択した推定方法を示す推定動きベクトルインデックスPMVIと共に、予測方式制御部21dに供給する。
(変換・量子化部22)
変換・量子化部22は、(1)符号化対象画像から予測画像Predを減算した予測残差Dに対してブロック(変換単位)毎にDCT変換(Discrete Cosine Transform)等の周波数変換を施し、(2)周波数変換により得られた変換係数Coeff_IQを量子化し、(3)量子化により得られた変換係数Coeffを可変長符号符号化部27及び逆量子化・逆変換部23に供給する。なお、変換・量子化部22は、(1)量子化の際に用いる量子化ステップQPをTU毎に選択し、(2)選択した量子化ステップQPの大きさを示す量子化パラメータ差分Δqpを可変長符号符号化部28に供給し、(3)選択した量子化ステップQPを逆量子化・逆変換部23に供給する。ここで、量子化パラメータ差分Δqpとは、周波数変換及び量子化するTUに関する量子化パラメータqp(例えばQP=2pq/6)の値から、直前に周波数変換及び量子化したTUに関する量子化パラメータqp’の値を減算して得られる差分値のことを指す。
なお、変換・量子化部22によって行われるDCT変換は、例えば、対象ブロックのサイズが8×8画素である場合、水平方向の周波数uおよび垂直方向の周波数vについての量子化前の変換係数をCoeff_IQ(u、v)(0≦u≦7、0≦v≦7)と表すことにすると、例えば、以下の数式(2)によって与えられる。
Figure 0006560702
ここで、D(i、j)(0≦i≦7、0≦j≦7)は、対象ブロックにおける位置(i、j)での予測残差Dを表している。また、C(u)およびC(v)は、以下のように与えられる。
・C(u)=1/√2 (u=0)
・C(u)=1 (u≠0)
・C(v)=1/√2 (v=0)
・C(v)=1 (v≠0)
(逆量子化・逆変換部23)
逆量子化・逆変換部23は、(1)量子化された変換係数Coeffを逆量子化し、(2)逆量子化によって得られた変換係数Coeff_IQに対して逆DCT(Discrete Cosine Transform)変換等の逆周波数変換を施し、(3)逆周波数変換によって得られた予測残差Dを加算器24に供給する。量子化された変換係数Coeffを逆量子化する際には、変換・量子化部22から供給された量子化ステップQPを利用する。なお、逆量子化・逆変換部23から出力される予測残差Dは、変換・量子化部22に入力される予測残差Dに量子化誤差が加わったものであるが、ここでは簡単のために共通の呼称を用いる。逆量子化・逆変換部23のより具体的な動作は、動画像復号装置1の備える逆量子化・逆変換部13とほぼ同様である。
(加算器24)
加算器24は、予測方式制御部21dにて選択された予測画像Predを、逆量子化・逆変換部23にて生成された予測残差Dに加算することによって、(局所)復号画像Pを生成する。加算器24にて生成された(局所)復号画像Pは、ループフィルタ26に供給されると共にフレームメモリ25に格納され、イントラ予測における参照画像として利用される。
(可変長符号符号化部27)
可変長符号符号化部27は、(1)変換・量子化部22から供給された量子化後の変換係数Coeff並びにΔqp、(2)予測方式制御部21dから供給された量子化パラメータPP(インター予測パラメータPP_Inter、および、イントラ予測パラメータPP_Intra)、(3)予測タイプ情報Pred_type、および、(4)ループフィルタ26から供給されたフィルタパラメータFPを可変長符号化することによって、符号化データ#1を生成する。
図27は、可変長符号符号化部27の構成を示すブロック図である。図27に示すように、可変長符号符号化部27は、量子化後の変換係数Coeffを符号化する量子化残差情報符号化部271、予測パラメータPPを符号化する予測パラメータ符号化部272、予測タイプ情報Pred_typeを符号化する予測タイプ情報符号化部273、および、フィルタパラメータFPを符号化するフィルタパラメータ符号化部274を備えている。量子化残差情報符号化部271の具体的な構成については後述するためここでは説明を省略する。
(減算器28)
減算器28は、予測方式制御部21dにて選択された予測画像Predを、符号化対象画像から減算することによって、予測残差Dを生成する。減算器28にて生成された予測残差Dは、変換・量子化部22によって周波数変換及び量子化される。
(ループフィルタ26)
ループフィルタ26は、(1)復号画像Pにおけるブロック境界、またはパーティション境界の周辺の画像の平滑化(デブロック処理)を行うデブロッキングフィルタ(DF:Deblocking Filter)としての機能と、(2)デブロッキングフィルタが作用した画像に対して、フィルタパラメータFPを用いて適応フィルタ処理を行う適応フィルタ(ALF:Adaptive Loop Filter)としての機能を有している。
(量子化残差情報符号化部271)
量子化残差情報符号化部271は、量子化された変換係数Coeff(uiPosX、uiPosY)をコンテキスト適応型2値算術符号化(CABAC:(Context-based Adaptive Binary Arithmetic Coding))することによって、量子化残差情報QDを生成する。生成された量子化残差情報QDに含まれるシンタックスは、図5に示した通りである。
なお、uiPosXおよびuiPosYは、上述のように、周波数領域における各周波数成分の位置を表すインデックスであり、それぞれ、上述した水平方向周波数uおよび垂直方向周波数vに対応するインデックスである。なお、以下では、量子化された変換係数Coeffを、単に、変換係数Coeffと呼ぶこともある。
(量子化残差情報符号化部271)
図28は、量子化残差情報符号化部271の構成を示すブロック図である。図28に示すように、量子化残差情報符号化部271は、変換係数符号化部220及び算術符号符号化部230を備えている。
(算術符号符号化部230)
算術符号符号化部230は、変換係数符号化部220から供給される各Binをコンテキストを参照して符号化することによって量子化残差情報QDを生成するための構成であり、図1に示すように、コンテキスト記録更新部231及びビット符号化部232を備えている。
(コンテキスト記録更新部231)
コンテキスト記録更新部231は、各コンテキストインデックスctxIdxによって管理されるコンテキスト変数CVを記録及び更新するための構成である。ここで、コンテキスト変数CVには、(1)発生確率が高い優勢シンボルMPS(most probable symbol)と、(2)その優勢シンボルMPSの発生確率を指定する確率状態インデックスpStateIdxとが含まれている。
コンテキスト記録更新部231は、変換係数符号化部220の備える各部から供給されるコンテキストインデックスctxIdx及びビット符号化部232によって符号化されたBinの値を参照することによってコンテキスト変数CVを更新すると共に、更新されたコンテキスト変数CVを次回更新されるまで記録する。なお、優勢シンボルMPSは0か1である。また、優勢シンボルMPSと確率状態インデックスpStateIdxは、ビット符号化部132がBinを1つ符号化する毎に更新される。
また、コンテキストインデックスctxIdxは、各周波数成分についてのコンテキストを直接指定するものであってもよいし、処理対象のTU毎に設定されるコンテキストインデックスのオフセットからの増分値であってもよい(以下同様)。
(ビット符号化部232)
ビット符号化部232は、コンテキスト記録更新部231に記録されているコンテキスト変数CVを参照し、変換係数符号化部220の備える各部から供給される各Binを符号化することによって量子化残差情報QDを生成する。また、符号化したBinの値はコンテキスト記録更新部231にも供給され、コンテキスト変数CVを更新するために参照される。
(変換係数符号化部220)
図28に示すように、変換係数符号化部220は、ラスト位置符号化部221、スキャン順テーブル格納部222、係数符号化制御部223、係数有無フラグ符号化部、係数値符号化部225、符号化係数記憶部226及びシンタックス導出部227を備えている。
(シンタックス導出部227)
シンタックス導出部227は、変換係数Coeff(uiPosX、uiPosY)の各値を参照し、対象周波数領域におけるこれらの変換係数を特定するためのシンタックスlast_significant_coeff_x、last_significant_coeff_y、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、及びcoeff_abs_level_minus3の各値を導出する。導出された各シンタックスは、符号化係数記憶部226に供給される。また、導出されたシンタックスのうちlast_significant_coeff_x、last_significant_coeff_yは、係数符号化制御部223及びラスト位置符号化部221にも供給される。また、導出されたシンタックスのうちsignificant_coeff_flagは、係数有無フラグ符号化部224もに供給される。なお、各シンタックスが示す内容については上述したためここでは説明を省略する。
(ラスト位置符号化部221)
ラスト位置符号化部221は、シンタックス導出部227より供給されるシンタックスlast_significant_coeff_x、last_significant_coeff_yを符号化する。また、これらのシンタックスを符号化して得られた各Binをビット符号化部232に供給する。また、シンタックスlast_significant_coeff_x及びlast_significant_coeff_yの符号化に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部231に供給される。
(スキャン順テーブル格納部222)
スキャン順テーブル格納部222には、処理対象のTUのサイズ、スキャン方向の種別を表すスキャンインデックス、及びスキャン順に沿って付与された周波数成分識別インデックスを引数として、処理対象の周波数成分の周波数領域における位置を与えるテーブルが格納されている。このようなスキャン順テーブルの一例としては、図5に示したScanOrderが挙げられる。
(係数符号化制御部223)
係数符号化制御部223は、量子化残差情報符号化部271の備える各部における符号化処理の順序を制御するための構成である。係数符号化制御部223は、シンタックス導出部227より供給されるシンタックスlast_significant_coeff_x及びlast_significant_coeff_yを参照し、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、特定した最後の非0変換係数の位置を起点とするスキャン順であって、スキャン順テーブル格納部222に格納されたスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、各周波数成分の位置(uiPosX、uiPosY)を、係数有無フラグ符号化部に供給する。
なお、係数符号化制御部223は、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、最初の成分(DC成分)を起点とし、特定した最後の非0変換係数の位置を終端とするスキャン順であって、スキャン順テーブル格納部222に格納されたスキャン順テーブルよって与えられるスキャン順の順スキャン順に、各周波数成分の位置(uiPosX、uiPosY)を、係数有無フラグ符号化部に供給する構成としてもよい。
(係数値符号化部225)
係数値符号化部225は、シンタックス導出部227から供給されるシンタックスcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、及びcoeff_abs_level_minus3を符号化する。また、これらのシンタックスを符号化して得られた各Binをビット符号化部232に供給する。また、これらのシンタックスの符号化に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部231に供給される。
(符号化係数記憶部226)
符号化係数記憶部226は、シンタックス導出部227によって導出されたシンタックスの各値を記憶しておくための構成である。特に、符号化係数記憶部226には、シンタックス導出部227によって導出されたシンタックスsignificant_coeff_flagの各値が記憶される。
(係数有無フラグ符号化部)
本実施形態に係る係数有無フラグ符号化部は、周波数領域を、周波数の大きさに応じて1または複数の部分領域に分類し、部分領域毎に定められた導出方法によってコンテキストインデックスctxIdxを導出すると共に、導出したコンテキストインデックスctxIdxを用いて非0変換係数の有無を示すシンタックスsignificant_coeff_flagを符号化するための構成である。
<係数有無フラグ符号化部の第1の構成例>
図28には、本実施形態に係る係数有無フラグ符号化部の第1の構成例としての係数有無フラグ符号化部224が示されている。
図28に示すように、本構成例に係る係数有無フラグ符号化部224は、周波数分類部224a、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、高周波位置コンテキスト導出部224dを備えている。
(周波数分類部224a)
周波数分類部224aは、周波数領域における符号化対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、及び高周波位置コンテキスト導出部224dの何れかによって導出されたコンテキストインデックスctxIdxを、当該符号化対象の周波数成分に割り付けるための構成である。
周波数分類部224aは、算術符号符号化部230でシンタックスsignificant_coeff_flagを符号化するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズおよび復号対象の周波数成分毎に算出される。
本構成例に係る周波数分類部224aによる他の具体的は処理は、動画像復号装置1の備える周波数分類部124aと同様であるため、ここでは説明を省略する。
(低周波位置コンテキスト導出部224b)
低周波位置コンテキスト導出部224bは、符号化対象の周波数成分が、低周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出するための構成である。
本構成例に係る低周波位置コンテキスト導出部224bによる具体的な処理は、動画像復号装置1の備える低周波位置コンテキスト導出部124bと同様であるため、ここでは説明を省略する。
(周辺参照コンテキスト導出部224c)
周辺参照コンテキスト導出部224cは、符号化対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について符号化済みの非0変換係数の数に基づいて導出するための構成である。
本構成例に係る周辺参照コンテキスト導出部224cによる具体的な処理は、動画像復号装置1の備える周辺参照コンテキスト導出部224cと同様であるため、ここでは説明を省略する。
(高周波位置コンテキスト導出部224d)
高周波位置コンテキスト導出部224dは、符号化対象の周波数成分が、高周波数側の部分領域に含まれる場合に、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出するための構成である。
本構成例に係る高周波位置コンテキスト導出部224dによる具体的な処理は、動画像復号装置1の備える高周波位置コンテキスト導出部124dと同様であるため、ここでは説明を省略する。
<係数有無フラグ符号化部の第2の構成例>
本実施形態に係る係数有無フラグ符号化部は、動画像復号装置1の備える係数有無フラグ復号部124−1に対応する構成としてもよい。
具体的には、本構成例に係る係数有無フラグ符号化部は、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124c、前スキャン列コンテキスト導出部124e、及び非0変換係数カウント部124fと同様の各部を備える構成とすることができる。
これらの各部については、動画像復号装置1の備える係数有無フラグ復号部124−1の説明において述べたためここでは説明を省略する。
<係数有無フラグ符号化部の第3の構成例>
本実施形態に係る係数有無フラグ符号化部は、動画像復号装置1の備える係数有無フラグ復号部124−2に対応する構成としてもよい。
具体的には、本構成例に係る係数有無フラグ符号化部は、周波数分類部124a、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124gと同様の各部を備える構成とすることができる。
これらの各部については、動画像復号装置1の備える係数有無フラグ復号部124−2の説明において述べたためここでは説明を省略する。
また、係数有無フラグ復号部124−2の構成は、係数有無フラグ符号化部の第3の構成例の別の構成例に示す構成としてもよい。
<係数有無フラグ符号化部の第4の構成例>
本実施形態に係る係数有無フラグ符号化部は、動画像復号装置1の備える係数有無フラグ復号部124’に対応する構成としてもよい。
具体的には、本構成例に係る係数有無フラグ符号化部は、周波数分類部124a´、低周波位置コンテキスト導出部124b、周辺参照コンテキスト導出部124g、および高周波位置コンテキスト導出部124dと同様の各部を備える構成とすることができる。
これらの各部については、動画像復号装置1の備える係数有無フラグ復号部124’の説明において述べたためここでは説明を省略する。
<係数有無フラグ符号化部の第5の構成例>
本実施形態に係る係数有無フラグ符号化部は、動画像復号装置1の備える係数有無フラグ復号部124−3に対応する構成としてもよい。
具体的には、本構成例に係る係数有無フラグ符号化部は、周波数分類部124a、低周波位置コンテキスト導出部124b、高周波領域コンテキスト導出部124h、周辺参照コンテキスト導出部124i、前スキャン列コンテキスト導出部124e、非0変換係数カウント部124fと同様の各部を備える構成とすることができる。
これらの各部については、動画像復号装置1の備える係数有無フラグ復号部124−3の説明において述べたためここでは説明を省略する。
<係数有無フラグ符号化部の第6の構成例>
本実施形態に係る係数有無フラグ符号化部は、動画像復号装置1の備える係数有無フラグ復号部124−4に対応する構成としてもよい。
具体的には、本構成例に係る係数有無フラグ符号化部は、周波数分類部124a、低周波位置コンテキスト導出部124b、及び周辺参照コンテキスト導出部124kと同様の各部を備える構成とすることができる。
これらの各部については、動画像復号装置1の備える係数有無フラグ復号部124−4の説明において述べたためここでは説明を省略する。
以下では、動画像復号装置1の備える係数有無フラグ復号部の第7〜第9の構成に対応する係数有無フラグ符号化部の第7〜第9の構成について説明する。係数有無フラグ符号化部の第7〜第9の構成は、周波数領域の全体を1つの変換ブロックとして係数有無フラグを符号化するのではなく、変換ブロックを例えば4×4のサブブロックに分割し、サブブロックを単位として係数有無フラグを符号化する。図32は、第7〜第9の構成に係る係数有無フラグ符号化部によるサブブロックスキャンを示している。サブブロックを用いて係数有無フラグを符号化する場合には、サブブロック単位で、サブブロック内に少なくとも1つの非0変換係数が存在するか示すフラグ(サブブロック係数有無フラグ)をサブブロック逆スキャン順に符号化する。さらに、サブブロック係数有無フラグが非0である場合において、サブブロック内部の各変換係数について係数有無フラグをサブブロック内部の逆スキャン順に符号化する。
<係数有無フラグ符号化部の第7の構成>
図44は、係数有無フラグ復号部124−Aに対応する係数有無フラグ符号化部224−Aの構成を示すブロック図である。また、図43は、本構成例に係る係数有無フラグ符号化部224−Aの動作の流れを示すフローチャートである。
図44に示すように、本構成例に係る係数有無フラグ符号化部224−Aは、サブブロック係数有無フラグ符号化部X2,周波数分類部224a、低周波位置コンテキスト導出部224b、及び周辺参照コンテキスト導出部224cを備えている。
(サブブロック係数有無フラグ符号化部X2)
サブブロック係数有無フラグ符号化部X2は、シンタックス導出部227より供給された対象変換ブロックの周波数領域を構成する各サブブロックの中に少なくとも1つ非0の変換係数が存在するか否かを示すサブブロック係数有無フラグ(significant_coeffgroup_flag)を符号化する(図43のステップSY1’)。また、サブブロック係数有無フラグを符号化して得られた各Binをビット符号化部232に供給する。
続いて、サブブロック係数有無フラグ符号化部X2は、変換ブロック内にあるサブブロック毎に、サブブロック内に係数有無フラグを符号化する(図43のステップSY2’〜ステップSY4’)。すなわち、サブブロック係数有無フラグ符号化部X2において、サブブロック係数有無フラグが1の場合(図43のステップSY2’においてYの場合)、周波数分類部224a、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224cを用いてサブブロック内の係数有無フラグを符号化する。また、サブブロック係数有無フラグが0の場合(図43のステップSY2’において、Nの場合)、サブブロック内の係数有無フラグの符号化をスキップし、次のサブブロックの処理へ移行する。
なお、図43のサブブロックのループにおいて、sbkIdxは、サブブロックの順スキャンでの対象サブブロックのスキャン順番号を表し、LastSbkIdxは、サブブロックの順スキャンでのラスト係数のあるサブブロックのスキャン順番号を表わす。sz×szの変換ブロックを4×4サブブロックに分割する場合、sbkIdx、およびLastSbkIdxのとる値は、0〜(sz>>2)×(sz>>2)-1である。
(係数有無フラグ符号化部224−Aの備える周波数分類部224a)
係数有無フラグ符号化部224−Aの備える周波数分類部224aは、周波数領域における符号化対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部224b、及び周辺参照コンテキスト導出部224cの何れかによって導出されたコンテキストインデックスctxIdxを、当該符号化対象の周波数成分に割り付ける(図43のステップSY3’)。
係数有無フラグ符号化部224−Aの備える周波数分類部224aは、算術符号化部230でシンタックスsignificant_coeff_flagを符号化するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズ及び符号化対象の周波数成分毎に算出される(図43のステップSY4’)。
係数有無フラグ符号化部224−Aの備える周波数分類部224aによる他の具体的処理は、係数有無フラグ復号部124−Aにおける周波数分類部124aと同様であるため、ここでは説明を省略する。
以下では、各部分領域R0〜R2に対応するコンテキスト導出について説明する。
(係数有無フラグ符号化部224−Aの備える低周波位置コンテキスト導出部224b)
係数有無フラグ符号化部224−Aの備える低周波位置コンテキスト導出部224bは、符号化対象の周波数成分が、低周波側の部分領域に含まれる場合、当該周波数成分に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置に基づいて導出する。
本構成例に係る低周波位置コンテキスト導出部224bは、部分領域R0に属する周波数成分に対して、係数有無フラグ復号部124−Aにおける低周波位置コンテキスト導出部124bと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
(係数有無フラグ符号化部224−Aの備える周辺参照コンテキスト導出部224c)
係数有無フラグ符号化部224−Aの備える周辺参照コンテキスト導出部224cは、符号化対象の周波数成分に対するコンテキストインデックスctxIdxを、当該周波数成分の周辺の周波数成分について符号化済みの非0変換係数の数に基づいて導出する。
本実施形態に係る周辺参照コンテキスト導出部224cは、部分領域R1、及びR2に属する周波数成分に対して、係数有無フラグ復号部124−Aにおける周辺参照コンテキスト導出部124cと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
<係数有無フラグ符号化部の第8の構成>
図45は、係数有無フラグ復号部124−Bに対応する係数有無フラグ符号化部224−Bの構成を示すブロック図である。また、係数有無フラグ符号化部224−Bの動作の流れは、図43に示すフローチャートを用いて説明される。
図45に示すように、本構成例に係る係数有無フラグ符号化部224−Bは、サブブロック係数有無フラグ符号化部X2,周波数分類部224a、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、及び高周波位置コンテキスト導出部224dを備えている。
(係数有無フラグ符号化部224−Bの備えるサブブロック係数有無フラグ符号化部X2)
係数有無フラグ符号化部224−Bの備えるサブブロック係数有無フラグ符号化部X2は、シンタックス導出部227より供給された対象変換ブロックの周波数領域を構成する各サブブロックの中に少なくとも1つ非0の変換係数が存在するか否かを示すサブブロック係数有無フラグ(significant_coeffgroup_flag)を符号化する(図43のステップSY1’)。また、サブブロック係数有無フラグを符号化して得られた各Binをビット符号化部232に供給する。
続いて、変換ブロック内にあるサブブロック毎に、サブブロック内に係数有無フラグを符号化する(図43のステップSY2’〜ステップSY4’)。すなわち、サブブロック係数有無フラグ符号化部X2において、サブブロック係数有無フラグが1の場合(図43のステップSY2’においてYの場合)、周波数分類部224a、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、高周波位置コンテキスト導出部224dを用いてサブブロック内の係数有無フラグを符号化する。また、サブブロック係数有無フラグが0の場合(図43のステップSY2’においてNの場合)、サブブロック内の係数有無フラグの符号化をスキップし、次のサブブロックの処理へ移行する。
(係数有無フラグ符号化部224−Bの備える周波数分類部224a)
係数有無フラグ符号化部224−Bの備える周波数分類部224aは、周波数領域における符号化対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、及び高周波位置コンテキスト導出部224dの何れかによって導出されたコンテキストインデックスctxIdxを、当該符号化対象の周波数成分に割り付ける(図43のステップSY3’)。
係数有無フラグ符号化部224−Bの備える周波数分類部224aは、算術符号化部230でシンタックスsignificant_coeff_flagを符号化するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズ及び符号化対象の周波数成分毎に算出される(図43のステップSY4’)。
係数有無フラグ符号化部224−Bの備える周波数分類部224aによる他の具体的処理は、係数有無フラグ復号部124−Bにおける周波数分類部124aと同様であるため、ここでは説明を省略する。
以下では、各部分領域R0〜R3に対応するコンテキスト導出について説明する。
(係数有無フラグ符号化部224−Bの備える低周波位置コンテキスト導出部224b)
係数有無フラグ符号化部224−Bの備える低周波位置コンテキスト導出部224bは、部分領域R0に属する周波数成分に対して、係数有無フラグ復号部124−Bにおける低周波位置コンテキスト導出部124bと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
(係数有無フラグ符号化部224−Bの備える周辺参照コンテキスト導出部224c)
係数有無フラグ符号化部224−Bの備える周辺参照コンテキスト導出部224cは、部分領域R1、及びR2に属する周波数成分に対して、係数有無フラグ復号部124−Bにおける周辺参照コンテキスト導出部124cと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
(係数有無フラグ符号化部224−Bの備える高周波位置コンテキスト導出部224d)
係数有無フラグ符号化部224−Bの備える高周波位置コンテキスト導出部224dは、符号化対象の周波数成分が、高周波数側の部分領域に含まれる場合に、当該周波数に対するコンテキストインデックスctxIdxを、周波数領域における当該周波数成分の位置と、当該周波数成分の属するサブブロックの位置に基づて導出する。
係数有無フラグ符号化部224−Bの備える高周波位置コンテキスト導出部224dは、部分領域R3に属する周波数成分に対して、係数有無フラグ復号部124−Cにおける高周波位置コンテキスト導出部124dと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
以上のように構成された周波数分類部224aによれば、変換係数の位置によりコンテキスト導出方法を切り替えるための分岐処理を、サブブロック座標(xCG、yCG)を用いた分岐処理にすることができる。(uiPosX、uiPosY)を参照する分岐処理を行う場合に比べ、サブブロック内部で行われる(uiPosX、uiPosY)を参照する分岐処理を省略することができ、コンテキスト導出のスループットを向上させることができる。
さらに、以上のように構成された係数有無フラグ符号化部およびサブブロック係数有無フラグ符号化部を備えることによって、位置コンテキストは、ある変換係数の位置の係数有無フラグのコンテキストを、既に符号化された係数有無フラグの値によらずに決定するため、係数有無フラグのコンテキスト導出と、係数有無フラグの符号化を並列で行うことができるという効果がある。
<係数有無フラグ符号化部の第9の構成>
図46は、係数有無フラグ復号部124−Cに対応する係数有無フラグ符号化部224−Cの構成を示すブロック図である。また、係数有無フラグ符号化部224−Cの動作の流れは、図43に示すフローチャートを用いて説明される。
図46に示すように、本構成例に係る係数有無フラグ符号化部224−Cは、サブブロック係数有無フラグ符号化部X2,周波数分類部224a、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、及び高周波位置コンテキスト導出部224dを備えている。
(係数有無フラグ符号化部224−Cの備えるサブブロック係数有無フラグ符号化部X2)
係数有無フラグ符号化部224−Cの備えるサブブロック係数有無フラグ符号化部X2は、係数有無フラグ符号化部224−Bの係数有無フラグ符号化部X2と同様であるため、説明を省略する。
(周波数分類部224a)
係数有無フラグ符号化部224−Cの備える周波数分類部224aは、周波数領域における符号化対象の周波数成分の位置に応じて、当該周波数成分を複数の部分領域の何れかに分類すると共に、低周波位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、及び高周波位置コンテキスト導出部224dの何れかによって導出されたコンテキストインデックスctxIdxを、当該符号化対象の周波数成分に割り付ける(図43のステップSY3’)。
係数有無フラグ符号化部224−Cの備える周波数分類部224aは、算術符号化部230でシンタックスsignificant_coeff_flagを符号化するために用いるコンテキストを決定するための、コンテキストインデックスctxIdxを算出する。コンテキストインデックスctxIdxは、周波数領域のサイズ及び符号化対象の周波数成分毎に算出される(図43のステップSY4’)。
係数有無フラグ符号化部224−Cの備える周波数分類部224aによる他の具体的処理は、係数有無フラグ復号部124−Cにおける周波数分類部124aと同様であるため、ここでは説明を省略する。
以下では、各部分領域R0〜R4に対応するコンテキスト導出について説明する。
(係数有無フラグ符号化部224−Cの備える低周波位置コンテキスト導出部224b)
係数有無フラグ符号化部224−Cの備える低周波位置コンテキスト導出部224bは、部分領域R0に属する周波数成分に対して、係数有無フラグ復号部124−Cにおける低周波位置コンテキスト導出部124bと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
(係数有無フラグ符号化部224−Cの備える周辺参照コンテキスト導出部224c)
係数有無フラグ符号化部224−Cの備える周辺参照コンテキスト導出部224cは、部分領域R1、R2、及びR3に属する周波数成分に対して、係数有無フラグ復号部124−Cにおける周辺参照コンテキスト導出部124cと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
(係数有無フラグ符号化部224−Cの備える高周波位置コンテキスト導出部224d)
係数有無フラグ符号化部224−Cの備える高周波位置コンテキスト導出部224dは、部分領域R4に属する周波数成分に対して、係数有無フラグ復号部124−Cにおける高周波位置コンテキスト導出部124dと同様の処理により、コンテキストインデックスctxIdxを導出し、その導出結果ctxIdxを周波数分類部224aへ供給する。
以上のように、本構成例に係る係数有無フラグ符号化部224−Cによれば、所定の閾値THFより高周波数側の部分領域(例えば、図41の部分領域R3)では、各変換係数有無フラグに割り付けるコンテキストインデックス導出において、参照する符号化済みの非0変換係数の数が、低周波数側の部分領域(例えば、図41の部分領域R2)において参照する符号化済みの非0変換係数の数よりも小さいため、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。さらに別の閾値THGより高周波数側の部分領域(例えば、図41の部分領域R4)においては、コンテキストインデックスを周囲参照によらず位置に基づいて導出するので、さらに処理量を削減することができる。また、位置参照は、コンテキストの導出に既に符号化した係数有無フラグの値を用いないため、並列性も向上させることができる。
以上のように、本構成例に係る係数有無フラグ符号化部224−Cにおいて、周波数分類部224aは、対象周波数領域を、処理対象の変換係数有無フラグの位置と、その変換係数有無フラグが属するサブブロックの位置に応じて、少なくとも3つの部分領域に分類するものであり、
周辺参照コンテキスト導出部224cは、
第1の部分領域(部分領域R1またはR2)では、復号済みの非0変換係数をN1個(N1は自然数)参照し、
第2の部分領域(部分領域R3)では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、
第3の部分領域(部分領域R4)では、高周波位置コンテキスト導出部224dが、変換係数有無フラグの属するサブブロックの位置に応じて、コンテキストインデックスを導出する。
上記の構成によれば、コンテキストインデックスを導出するために参照する符号化済みの非0変換係数の数がより小さく設定された部分領域と、対象周波数領域における該変換係数有無フラグの位置と、該変換係数有無フラグの属するサブブロックの位置とに基づいてコンテキストインデックスを導出する部分領域とを組み合わせることによって、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
(変換係数符号化部220の他の構成例1)
以上、本実施形態に係る変換係数符号化部220について、主に係数有無フラグ符号化部の構成例を中心に説明したが、本実施形態に係る変換係数符号化部220の構成は、上記の例に限られるものではない。
例えば、変換係数符号化部220は、下記の条件
uiPosX+uiPosY<TH2
を満たす周波数成分についての変換係数のみを符号化するよう制限する構成とし、当該制限を適用したか否かを示すフラグhigh_coeff_restriction_flagを、符号化データ#1のシーケンスパラメータセットSPSに含める構成としてもよい。
また、処理対象のTUが特定のサイズ(例えば、32×32や16×16)である場合にのみ、上記の制限を適用する構成としてもよい。
具体的な制限の例、及びそれに関連する処理については、(変換係数復号部120の他の構成例1)において述べたものと同様であるため、ここでは説明を省略する。
(変換係数符号化部220の他の構成例2)
また、対象TUのサイズが8×8画素である場合、変換係数符号化部220の備える係数有無フラグ符号化部は、以下の式を用いてコンテキストインデックスctxIdxを導出し、各周波数成分に割り付ける構成としてもよい。
ctxIdx=N8+4×tbl[uiPosY]+tbl[uiPosX]
ここで、
tbl={0、1、1、2、2、3、3、3}
である。
なお、N8は、周波数領域のサイズが8×8の場合のコンテキストインデックスの開始点である。
本構成例に係る係数有無フラグ符号化部による処理は、(変換係数復号部120の他の構成例2)において述べたものと同様であるため、ここでは説明を省略する。
(動画像復号装置3)
以下では、本実施形態に係る動画像復号装置の他の例としての動画像復号装置3について図61〜図73を参照して説明する。以下では、既に説明した部分と同じ部分については同じ符号を付し、その説明を省略する。
動画像復号装置3は、図7の動画像復号装置1において量子化残差情報復号部111の代わりに量子化残差情報復号部Y111を備えている。
図61は、動画像復号装置3の量子化残差情報復号部Y111の構成を示すブロック図である。図61に示すように、量子化残差情報復号部Y111は、変換係数復号部Y120及び算術符号復号部130を備えている。
図61に示すように、変換係数復号部Y120は、ラスト係数位置復号部121、スキャン順テーブル格納部122、係数復号制御部123、係数有無フラグ復号部Y124、係数値復号部Y125、復号係数記憶部126、及び、サブブロック係数有無フラグ復号部Y127を備えている。
(スキャン順テーブル格納部122)
スキャン順テーブル格納部122には、処理対象のTU(ブロック)のサイズ、スキャン方向の種別を表すスキャンインデックス、及びスキャン順に沿って付与された周波数成分識別インデックスを引数として、処理対象の周波数成分の周波数領域における位置を与えるテーブルが格納されている。
また、スキャン順テーブル格納部122には、サブブロックのスキャン順を指定するためのサブブロックスキャン順テーブルが格納されている。
(係数復号制御部123)
係数復号制御部123は、量子化残差情報復号部Y111の備える各部における復号処理の順序を制御するための構成である。
(ブロックサイズが所定のサイズ以下である場合)
ブロックサイズが所定のサイズ以下である場合、係数復号制御部123は、ラスト係数位置復号部121から供給されるシンタックスlast_significant_coeff_x及びlast_significant_coeff_yを参照し、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、特定した最後の非0変換係数の位置を起点とするスキャン順であって、スキャン順テーブル格納部122に格納されたスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、各周波数成分の位置(xC、yC)を、係数有無フラグ復号部Y124及び復号係数記憶部126に供給する。
また、係数復号制御部123は、処理対象のTUのサイズ、すなわち、対象周波数領域のサイズを示すパラメータであるszを、変換係数復号部Y120の備える各部に供給する(図示省略)。ここで、szは、具体的には、処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表すパラメータである。
なお、係数復号制御部123は、スキャン順テーブル格納部122に格納されたスキャン順テーブルよって与えられるスキャン順の順スキャン順に、各周波数成分の位置(xC、yC)を、係数有無フラグ復号部に供給する構成としてもよい。
(ブロックサイズが所定のサイズよりも大きい場合)
ブロックサイズが所定のサイズよりも大きい場合、係数復号制御部123は、ラスト係数位置復号部121から供給されるシンタックスlast_significant_coeff_x及びlast_significant_coeff_yを参照し、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、特定した最後の非0変換係数を含むサブブロックの位置を起点とするスキャン順であって、スキャン順テーブル格納部122に格納されたサブブロックスキャン順テーブルによって与えられるスキャン順の逆スキャン順に、各サブブロックの位置(xCG、yCG)を、サブブロック係数有無フラグ復号部Y127に供給する。
また、係数復号制御部123は、処理対象となるサブブロックに関して、スキャン順テーブル格納部122に格納されたスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、当該処理対象となるサブブロックに含まれる各周波数成分の位置(xC、yC)を、係数有無フラグ復号部Y124及び復号係数記憶部126に供給する。ここで、処理対象となるサブブロックに含まれる各周波数成分のスキャン順としては、具体的には、斜め方向スキャン(Up-right diagonal scan)を用いればよい。
(サブブロック係数有無フラグ復号部Y127)
サブブロック係数有無フラグ復号部Y127は、ビット復号部132から供給される各Binを解釈し、各サブブロック位置(xCG、yCG)によって指定されるシンタックスsignificant_coeffgroup_flag[xCG][yCG]を復号する。また、サブブロック係数有無フラグ復号部Y127は、算術符号復号部130にてシンタックスsignificant_coeffgroup_flag[xCG][yCG]のBinを復号するために用いられるコンテキストを決定するためのコンテキストインデックスctxIdxを算出する。算出されたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。ここで、シンタックスsignificant_coeffgroup_flag[xCG][yCG]は、サブブロック位置(xCG、yCG)によって指定されるサブブロックに、少なくとも1つの非0変換係数が含まれている場合に1をとり、非0変換係数が1つも含まれていない場合に0をとるシンタックスである。復号されたシンタックスsignificant_coeffgroup_flag[xCG][yCG]の値は、復号係数記憶部126に格納される。
(係数有無フラグ復号部Y124)
本実施形態に係る係数有無フラグ復号部Y124は、各係数位置(xC、yC)によって指定されるシンタックスsignificant_coeff_flag[xC][yC]を復号する。復号されたシンタックスsignificant_coeff_flag[xC][yC]の値は、復号係数記憶部126に格納される。また、量係数有無フラグ復号部Y124は、算術符号復号部130にてシンタックスsignificant_coeff_flag[xC][yC]のBinを復号するために用いられるコンテキストを決定するためのコンテキストインデックスctxIdxを算出する。算出されたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。
(係数値復号部Y125)
係数値復号部Y125は、ビット復号部132から供給される各Binを解釈し、処理対象の周波数成分における変換係数(より具体的には非0変換係数)の値を導出する。また、各種シンタックスの復号に用いたコンテキストインデックスctxIdxは、コンテキスト記録更新部131に供給される。導出された変換係数の値は、復号係数記憶部126に格納される。
(復号係数記憶部126)
復号係数記憶部126は、係数値復号部Y125によって復号された変換係数の各値を記憶しておくための構成である。また、復号係数記憶部126には、量係数有無フラグ復号部Y124によって復号されたシンタックスsignificant_coeff_flagの各値が記憶される。復号係数記憶部126によって記憶されている変換係数の各値は、逆量子化・逆変換部13に供給される。
(従来技術の量子化残差情報QDの構成)
図62、図63は、従来技術の量子化残差情報QDの構成を示す。図62及び図63は、従来技術の量子化残差情報QD(図62ではresidual_coding_cabac()と表記)に含まれる各シンタックスが示されている。
図62は、量子化残差情報QDに含まれるシンタックスを示すシンタックステーブルの前半部分を示す図である。図63は、量子化残差情報QDに含まれるシンタックスを示すシンタックステーブルの後半部分を示す図である。
図62及び図63に示すように、量子化残差情報QDは、シンタックスlast_significant_coeff_x、last_significant_coeff_y、significant_coeffgroup_flag、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、coeff_abs_level_minus3を含んでいる。
量子化残差情報QDに含まれる各シンタックスは、コンテキスト適応型2値算術符号化(CABAC:(Context-based Adaptive Binary Arithmetic Coding))によって符号化されている。図62、図63のDescriptor欄のae(e)は、シンタックスがCABACで符号化されることを意味する。
図63のDescriptor欄のbypassは、当該シンタックスがバイパスで符号化されることを意味する。H.264/MPEG−4.AVCの規格書によればバイパスで符号化されるか否かは、コンテキストインデックスctxIdxの割り当てを示すテーブルがnaであることで示されるが、ここでは理解しやすいようにシンタックステーブル上に記した。従来技術において、coeff_sign_flag、coeff_abs_level_minus3はバイパスで符号化される。また、バイパスで符号化されるこの2つのシンタックスが連続しているため、この部分の復号処理で高いスループットが得られる。
(本実施形態の第1の構成の量子化残差情報QD)
図64〜図66は、本実施形態の第1の構成の量子化残差情報QDに含まれる各シンタックスが示されている。
図64は、量子化残差情報QDに含まれるシンタックスを示すシンタックステーブルの前半部分を示す図である。本構成では、CABAC処理の簡略化を行うか否かを示すフラグcabac_lowcomp_flagの値によって符号化データの構成を切り替える。cabac_lowcomp_flag=0の場合、すなわち簡略化処理を行わない場合には、図65に示すresidual_coding_cabac2_normal()が用いられ、逆にcabac_lowcomp_flag=1の場合、すなわち簡略化処理を行う場合には、図66に示すresidual_coding_cabac2_comp()が用いられる。図65、図66は、量子化残差情報QDに含まれるシンタックスを示すシンタックステーブルの後半部分を示す図である。
図64〜図66に示すように、量子化残差情報QDは、シンタックスlast_significant_coeff_x、last_significant_coeff_y、significant_coeffgroup_flag、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_sign_flagを含んでいる。またsignificant_coeff_flag、coeff_abs_level_greater1_flag、coeff_sign_flagはバイパス符号化される。
図64の前半部分、および図65に示す簡略化処理を行わない場合のシンタックス構成は、図4、図5に示す従来技術のシンタックスと同様である。
図66の簡略化処理を行う場合のシンタックスでは、変換係数の値を示すシンタックスsignificant_coeff_flagが非バイパスからバイパスに変更される。また、変換係数の絶対値を示すシンタックスが、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_abs_level_minus3の4つから、significant_coeff_flag、coeff_abs_level_minus1の2つに削減される。ある値の表現を複数のシンタックスで表現する場合、復号処理では、基本的には表現に必要なシンタックスの数だけのサイクル数が必要になる。従って、表現に必要なシンタックスを2つ削減すれば2サイクル以上スループットを向上させることができる。また、significant_coeff_flagとcoeff_abs_level_minus1は共にバイパスで符号化され、さらにスループットを向上させることができる。
以上の構成では、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、M1個(M1は自然数)のシンタックスを復号して各変換係数の値を復号する通常モードと、M2個(M2はM2<M1を満たす自然数)のシンタックスを復号して各変換係数の値を復号する簡略化モードとを選択的に用いることによって各変換係数の値を復号する構成の一例を示した。また、後述の図68〜図70の構成の簡略化構成も、このような構成を備える。
以上の構成では、また、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、上記シンタックス復号手段は、通常モードでは上記M1個のシンタックスについてコンテキストを用いて復号を行い、簡略化モードでは上記M2個のシンタックスについてコンテキストを用いて復号を行うことを特徴とする構成の一例を示した。また、後述の図68〜図70の構成の簡略化構成も、このような構成を備える。
なお、本データ構造に示すように、significant_coeffgroup_flagは非バイパス、すなわちコンテキストを用いて符号化することが望ましい。サブブロックのサイズが4×4の場合、significant_coeffgroup_flagは16個の周波数位置に対して1個のみしか存在しないため、コンテキストを用いてもスループットが低下することはない。
また、上記簡略化処理を行うモードを簡略化モードとも呼称し、上記簡略化処理を行わないモードを通常モードとも呼称する。
(本実施形態の変換係数簡略化処理の判定)
本符号化データを復号する係数有無フラグ復号部Y124および係数値復号部Y125は、簡略化フラグcabac_lowcomp_flagの値に応じて、通常処理と簡略化処理を切り替えることができる。cabac_lowcomp_flagは、SPS、PPS、スライスヘッダなどに含まれる上位レベル簡略化フラグxps_cabac_lowcomp_flagの値と、ラスト位置に応じて導出される。以下、簡略化フラグcabac_lowcomp_flagの導出方法を説明する。
図72は簡略化フラグcabac_lowcomp_flag導出処理を示すフローチャートである。係数復号制御部123は、各周波数領域での変換係数を復号する場合に、図72の処理を行い、cabac_lowcomp_flagを導出する。
まず、係数復号制御部123は、各周波数領域の復号毎に簡略化フラグcabac_lowcomp_flagを0に初期化する(SX101)。
続いて、係数復号制御部123は、上位レベル簡略化フラグxps_cabac_lowcomp_flagが有効を示す1であるか無効を示す0であるかの判定を行い、有効の場合にはSX103に遷移し、それ以外の場合、判定処理を終了する(SX102)。
また、係数復号制御部123は、last_significant_coeff_pos_x、last_significant_coeff_pos_yで示されるラスト位置が所定の値より大きいか否かの判定を行う(SX103)。ラスト位置が所定の値よりも大きい場合には、簡略化フラグcabac_lowcomp_flagを有効であることを示す1に設定する(SX104)。
この処理によって、ラスト位置が所定の位置よりも大きい場合のような、変換係数が多く発生する場合には、高速なスループットである簡略化処理を用い、それ以外の場合には符号化効率の高い通常処理を行うことができる。簡略化処理を必要な場合にのみに限定することができるのでスループットを確保しながら高い符号化空率を実現できる。
図73は、図72のS103で示されるラスト位置が所定の値より大きいか否かの判定の具体例を示す図であり、(a)に示す処理と(b)に示す処理との2つの処理を示す。図73(a)の処理では、係数復号制御部123は、last_significant_coeff_pos_x、last_significant_coeff_pos_yの和と、周波数領域の幅と高さの最大値の定数倍(ここではa倍して2ビット右シフトした値)と大小比較を行う(SX103A)。係数復号制御部123は、この判定により、ラスト位置の和の方が大きい場合には、簡略化フラグを有効にし、逆の場合には簡略化フラグを無効にすれば良い。なお、例えば、上記aとしては3、4、5などの値を用いることができる。例えばaが4の場合には、ラスト位置がスキャン順の順序で約半分の数の位置を超えた場合に簡略化の動作が行われる。
図73(b)の処理は、周波数領域の幅widthと高さheightが同じ場合と異なる場合で異なる判定を行う。異なる場合とは例えば16×4変換、16×4変換、32×8変換、8×32変換などが該当する。図73(b)のフローチャートに示すように、係数復号制御部123は、周波数領域の幅widthと高さheightが同じであるか否かの判定を行う(SX103B)、同じ場合には、比較の閾値を定めるaにa1を設定し(SX103C)、異なる場合にはaにa2(ここではa2≦a1)を設定する(SX103D)。続いて、last_significant_coeff_pos_x、last_significant_coeff_pos_yの和と、周波数領域の幅と高さの最大値の定数倍(ここではa倍して2ビット右シフトした値)と大小比較を行う(SX103A)。このように判定に用いる閾値として、周波数領域の幅widthと高さheightが異なる場合に、周波数領域の幅widthと高さheightが同じ場合のよりも相対的に小さい値を用いることによって、ラスト位置がスキャン順の順序で、全体のどの程度の割合の位置であるかに基づいて、判定を行うことができる。a1及びa2として、例えば、a2=a1/2を満たすように選ぶことが適当であり、a1=4、a2=2などが適当である。
(本実施形態に掛る簡略化を行わない場合の係数有無フラグ復号部Y124および係数値復号部Y125の処理)
以下では、図65を参照して、本符号化データを復号する係数値復号部Y125の簡略化を行わない場合の処理を説明する。まず、係数値復号部Y125は、サブブロック単位での外部ループ(LP_Y70)と、サブブロック内の変換係数を復号する内部ループ(LP_Y71〜LP_Y75)の2重ループ処理により、変換係数を復号する。
係数有無フラグ復号部Y124は、第1の内部ループ(LP_Y71)を処理し、significant_coeff_flagの復号を行う。具体的には、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いる場合、すなわち、周波数領域の幅と高さの最大値が16以上である場合には、significant_coeffgroup_flagを参照し、significant_coeffgroup_flagが非0であり、かつ、ラスト位置以外の場合について、コンテキストを用いてsignificant_coeff_flagを復号する(SYN_Y71)。なお、ラスト位置か否かの判定は以下の式を用いる。
(xC != last_significant_coeff_x ) || ( yC != last_significant_coeff_y ))
逆に、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いない場合には、ラスト位置以外の場合について、コンテキストを用いてsignificant_coeff_flagを復号する(SYN_Y72)。
係数値復号部Y125は第2から第5の内部ループを処理する。
第2の内部ループ(LP_Y72)では、significant_coeff_flagが0以外である周波数上の位置についてコンテキストを用いてcoeff_abs_level_greater1_flagの復号を行う(SYN_Y73)。
第3の内部ループ(LP_Y73)では、coeff_abs_level_greater1_flagが0以外である周波数上の位置についてコンテキストを用いてcoeff_abs_level_greater2_flagの復号を行う(SYN_Y74)。
第4の内部ループ(LP_Y74)では、significant_coeff_flagが0以外である周波数上の位置についてバイパスによりcoeff_sign_flagの復号を行う(SYN_Y75)。
第5の内部ループ(LP_Y75)では、coeff_abs_level_greater2_flagが0以外である周波数上の位置についてバイパスによりcoeff_abs_level_minus3の復号を行う(SYN_Y76)。さらに、significant_coeff_flagが0以外である周波数上の位置について次の式により、変換係数の値を復号する。
( coeff_abs_level_minus3[ n ] + 3 ) * ( 1 ? 2 * coeff_sign_flag[ n ] )
以上の処理によって、変換係数の値が復号される。
(本実施形態の第1の簡略化構成の係数有無フラグ復号部Y124および係数値復号部Y125の処理)
次に、図66を参照して、本符号化データを復号する係数有無フラグ復号部Y124および係数値復号部Y125の簡略化を行う場合の処理を説明する。
係数有無フラグ復号部Y124は、第1の内部ループ(LP_Y81)を処理し、significant_coeff_flagの復号を行う。具体的には、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いる場合、すなわち、周波数領域の幅と高さの最大値が16以上である場合には、significant_coeffgroup_flagを参照し、significant_coeffgroup_flagが非0であり、かつ、ラスト位置以外の場合について、バイパスによりsignificant_coeff_flagを復号する(SYN_Y81)。逆に、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いない場合には、ラスト位置以外の場合について、バイパスによりsignificant_coeff_flagを復号する(SYN_Y82)。
係数値復号部Y125は第2から第3の内部ループを処理する。
第2の内部ループ(LP_Y82)では、significant_coeff_flagが0以外である周波数上の位置についてバイパスによりcoeff_sign_flagの復号を行う(SYN_Y83)。
第3の内部ループ(LP_Y83)では、significant_coeff_flagが0以外である周波数上の位置についてバイパスによりcoeff_abs_level_minus1の復号を行う(SYN_Y84)。さらに、significant_coeff_flagが0以外である周波数上の位置について次の式により、変換係数の値を復号する。
( coeff_abs_level_minus1[ n ] + 1 ) * ( 1 ? 2 * coeff_sign_flag[ n ] )
ここで、coeff_abs_level_minus1のバイナリ化は、ゴロム符号やハフマン符号などを用いればよい。
簡略化なしの処理と、簡略化有りの処理を比較すると、内部ループの回数が5回から3回に減少する。これによって複数回の内部ループを行う場合に比べループに必要な処理が減るためスループットが向上する。
以上、第1の構成の符号化データおよび本符号化データを復号する量子化残差情報復号部によれば、簡略化する場合において、変換係数の絶対値を示すシンタックスを1つのシンタックスcoeff_abs_level_minus1で表現し、非0変換係数の有無を示すフラグsignificant_coeff_flagと、符号フラグcoeff_sign_flag、絶対値−1の値coeff_abs_level_minus1を全てバイパスによって符号化/復号することにより、高いスループットの処理が可能になる。また、非0変換係数の有無を示すフラグの内、significant_coeffgroup_flagを非バイパスとし、significant_coeff_flagをバイパスとすることによって高い符号化効率を維持したまま高いスループットの処理が可能になる。
また、CAVLCのバイナリ化を用いる非特許文献2ではランモードとレベルモードの2つのモードを用いるのに対し、本実施形態の構成では1つのバイナリ化で簡略化処理が可能であるため、処理の構成が単純になるという効果を奏する。特にスループットが課題となる高ビットレートの領域では、変換係数が0となる割合が相対的に低下することから、ランモードと同様の符号化効率をレベルモードで実現できるという知見が有る。本構成では連続する0係数の数を符号化するランモードを用いず、レベルモードに相当する値を直接符号化するモードのみを用いるため、符号化効率を保ちながら、装置構成の複雑度を低下させることができる。第1の構成以外の以下の構成においても適用できる。
(本実施形態の第2の簡略化構成の量子化残差情報QD)
本実施形態の第2の簡略化構成では、図66に代わり図67のシンタックス構成を用いる。図67は、本実施形態の第2の簡略化構成の量子化残差情報QDに含まれる各シンタックスが示されている。
図66ではsignificant_coeff_flagがバイパス符号化されていたが、本構成ではコンテキストを用いる。変換係数の位置によっては、変換係数の値が0である確率が非常に大きいため、非0係数であるか否かを示すsignificant_coeff_flagを全てバイパスにする図66の構成では符号化効率の低下が大きくなることがある。本構成では最も重要なsignificant_coeff_flagに限ってコンテキストを用いることにより、図66の構成よりも高い符号化効率が得られる効果を奏する。
(本実施形態の第2の簡略化構成の係数有無フラグ復号部Y124および係数値復号部Y125の処理)
本実施形態の第2の簡略化構成では、係数有無フラグ復号部Y124で処理される第1の内部ループの処理が異なる。以下、図67に示される第1の内部ループ処理を説明する。
係数有無フラグ復号部Y124は、第1の内部ループ(LP_Y91)を処理し、significant_coeff_flagの復号を行う。具体的には、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いる場合、すなわち、周波数領域の幅と高さの最大値が16以上である場合には、significant_coeffgroup_flagを参照し、significant_coeffgroup_flagが非0であり、かつ、ラスト位置以外の場合について、コンテキストを用いてsignificant_coeff_flagを復号する(SYN_Y91)。逆に、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いない場合には、ラスト位置以外の場合について、コンテキストを用いてsignificant_coeff_flagを復号する(SYN_Y92)。
以上、第2の構成の符号化データおよび本符号化データを復号する量子化残差情報復号部によれば、変換係数の絶対値を示すシンタックスを1つのシンタックスcoeff_abs_level_minus1で表現し、非0変換係数の有無を示すフラグsignificant_coeff_flagにはコンテキスト用い、符号フラグcoeff_sign_flag、絶対値−1の値coeff_abs_level_minus1をバイパスによって符号化/復号することにより、高いスループットの処理が可能になる。また、非0変換係数の有無を示すフラグであるsignificant_coeffgroup_flagとsignificant_coeff_flagとを非バイパスとすることによって高い符号化効率を維持したまま高いスループットの処理が可能になる。
(本実施形態の第3の簡略化構成の量子化残差情報QD)
本実施形態の第3の簡略化構成では、図67に代わり図68のシンタックス構成を用いる。図68は、本実施形態の第3の簡略化構成の量子化残差情報QDに含まれる各シンタックスが示されている。
(本実施形態の第3の簡略化構成の係数有無フラグ復号部Y124および係数値復号部Y125の処理)
係数値復号部Y125の基本的な動作は第2の構成と同じであるが、第2の構成では、サブブロック内の処理において、符号フラグcoeff_sign_flag、絶対値−1の値coeff_abs_level_minus1を異なる内部ループで処理するが、第3の構成では、以下に示すように2つのシンタックスを一つの内部ループで処理する。
第1の内部ループ(LP_Y101)では、significant_coeff_flagの復号を行う。具体的には、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いる場合、すなわち、周波数領域の幅と高さの最大値が16以上である場合には、significant_coeffgroup_flagを参照し、significant_coeffgroup_flagが非0であり、かつ、ラスト位置以外の場合について、significant_coeff_flagを復号する(SYN_Y101)。逆に、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いない場合には、ラスト位置以外の場合について、significant_coeff_flagを復号する(SYN_Y102)。
第2の内部ループ(LP_Y102)では、significant_coeff_flagが0以外である周波数上の位置についてバイパスによりcoeff_sign_flagを復号を行う(SYN_Y103)。さらに、バイパスによりcoeff_abs_level_minus1の復号を行う(SYN_Y104)。さらに、significant_coeff_flagが0以外である周波数上の位置について次の式により、変換係数の値を復号する。
( coeff_abs_level_minus1[ n ] + 1 ) * ( 1 ? 2 * coeff_sign_flag[ n ] )
ここで、coeff_abs_level_minus1のバイナリ化は、ゴロム符号やハフマン符号などを用いればよい。
以上、第3の構成の符号化データの処理によれば、第1の処理、第2の処理に比べ、内部ループの回数が3回から2回に減少する。これによって複数回の内部ループを行う場合に比べ、ループに必要な処理、及び、significant_coeff_flagが0以外であるかを判定する処理が減るためスループットが向上する。すなわち、バイパスのシンタックスである符号フラグcoeff_sign_flag、絶対値−1の値coeff_abs_level_minus1を一つのループで処理するようにインターリーブして符号化することによってスループットを向上させることができる。すなわち、バイパスで処理される2つのシンタックスcoeff_sign_flag、coeff_abs_level_minus1を1つのループ内で連続して配置することによって、スループットを向上させることができる。
(適応的に簡略化を行う係数有無フラグ復号部Y124の処理)
以下、より適応的に簡略化を行う係数値復号部Y124の処理を説明する。図72、図73で説明した簡略化フラグcabac_lowcomp_flagの導出方法では、各周波数領域での変換係数を復号する最初の時点でラスト位置を参照することにより簡略化を行うか否かを設定していたが、以下の処理では、各周波数領域での変換係数を復号する最初の時点ではコンテキストを用いて復号処理を行い、周波数領域を構成する周波数成分を復号結果に応じて途中からコンテキストを用いた復号からバイパスによる復号に切り替える。
より具体的には、係数有無フラグ復号部Y124は、significant_coeff_flagにおいてコンテキストを用いるか否かを示すフラグsignificant_coeff_flag_modeを導出し、このフラグの値がsignificant_coeff_flag_modeが0の場合には、コンテキストを用いてsignificant_coeff_flagを復号し、significant_coeff_flag_modeが1の場合にはコンテキストを用いずバイパス処理によりsignificant_coeff_flagを復号する。
以下、図67の構成および図68の構成に対応する復号動作を説明する。
図67の構成の場合は以下の通りである。係数有無フラグ復号部Y124は、第1の内部ループ(LP_Y91)を処理し、significant_coeff_flagの復号を行う。具体的には、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いる場合、すなわち、周波数領域の幅と高さの最大値が16以上である場合には、significant_coeffgroup_flagを参照し、significant_coeffgroup_flagが非0であり、かつ、ラスト位置以外の場合について、significant_coeff_flagを復号する(SYN_Y91)。逆に、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いない場合には、ラスト位置以外の場合について、significant_coeff_flagを復号する(SYN_Y92)。図68の構成の場合は、上記説明においてLP_Y91、SYN_Y91、SYN_Y92をLP_Y101、SYN_Y101、SYN_Y102に置き換えた動作になる。適応な簡略化の処理では、SYN_Y91、SYN_Y92、SYN_Y101、SYN_Y102において、significant_coeff_flag_modeが0の場合にコンテキストを用いてsignificant_coeff_flagを復号し、significant_coeff_flag_modeが1の場合にバイパスによりsignificant_coeff_flagを復号する。
以下、非0係数の復号を簡略化するか否かを示すフラグsignificant_coeff_flag_modeの導出方法を以下2つ説明する。
非0係数の復号を簡略化するか否かを示すフラグsignificant_coeff_flag_modeの導出方法の例を以下に説明する。最初のサブブロックを処理ではsignificant_coeff_flag_modeを0に設定する。最初のサブブロック以外の処理では、前のサブブロックで設定された値を用いる。1つのサブブロックのsignificant_coeff_flagを復号する時点において、サブブロック内で発生する非0係数の数をカウントする。あるサブブロック内において、前記カウント(significant_coeff_flageの数)が所定の定数N個以上である場合にはsignificant_coeff_flag_modeを1に設定し、次のサブブロックを処理する。それ以外の場合には、前のサブブロックのsignificant_coeff_flag_modeの値を、そのまま次のサブブロックのsignificant_coeff_flag_modeとして用いる。
(本実施形態の第4、第5の簡略化構成の量子化残差情報QD)
本実施形態の第4、第5の簡略化構成では、各々図69、図70のシンタックス構成を用いる。図69、図70では、本実施形態の第4、第5の簡略化構成の量子化残差情報QDに含まれる各シンタックスが示されている。
第1〜第3の簡略化構成では、符号化データの値を示すシンタックスsignificant_coeff_flag、絶対値−1の値coeff_abs_level_minus1が2つであったが、第4、第5の構成では、ラスト位置以外は絶対値coeff_abs_levelの一つのシンタックスにすることが特徴である。なお、第4、第5の簡略化構成では、significant_coeff_flagの処理を行わない。そのため、第4、第5の構成では、係数有無フラグ復号部Y124は通常処理でのみ用いられ、簡略化処理の際には、係数有無フラグ復号部Y124は用いられない。
(本実施形態の第4の簡略化構成の係数値復号部Y125の処理)
係数値復号部Y125は、第1の内部ループ、第2の内部ループの処理を行う。
係数値復号部Y125は、第1の内部ループ(LP_Y111)では、coeff_abs_level_minus1及びcoeff_abs_levelの復号を行う。具体的には、対象変換係数の位置がラスト位置の場合には、バイパス処理によりcoeff_abs_level_minus1を復号し、coeff_abs_level=coeff_abs_level_minus1+1によりcoeff_abs_levelを導出する(SYN_Y111)。それ以外は以下の処理を行う。サブブロック係数有無フラグsignificant_coeffgroup_flagを用いる場合、すなわち、周波数領域の幅と高さの最大値が16以上である場合には、significant_coeffgroup_flagを参照し、significant_coeffgroup_flagが非0である場合についてバイパス処理によりcoeff_abs_levelを復号する(SYN_Y112)。逆に、サブブロック係数有無フラグsignificant_coeffgroup_flagを用いない場合にはバイパス処理によりcoeff_abs_levelを復号する(SYN_Y113)。
係数値復号部Y125は、第2の内部ループ(LP_Y112)では、coeff_abs_levelが0以外である周波数上の位置についてバイパスによりcoeff_sign_flagを復号を行う(SYN_Y114)。さらに、coeff_abs_levelが0以外である周波数上の位置について次の式により、変換係数の値を復号する。
( coeff_abs_level[ n ] ) * ( 1 ? 2 * coeff_sign_flag[ n ] )
以上、第4の構成の符号化データおよび本符号化データを復号する量子化残差情報復号部によれば、変換係数の絶対値であるcoeff_abs_level及び変換係数の絶対値−1であるcoeff_abs_level_minus1をバイパスで符号化することにより、復号処理のスループットを向上させる。非0変換係数の有無を示すフラグの内、significant_coeffgroup_flagを非バイパスとし、significant_coeff_flagをバイパスとすることによって高い符号化効率を維持したまま高いスループットの処理が可能になる。
(本実施形態の第5の簡略化構成の係数値復号部Y125の処理)
係数値復号部Y125は、第1の内部ループ、第2の内部ループの処理を行う。
係数値復号部Y125は、第1の内部ループ(LP_Y121)では、coeff_abs_levelの復号を行う。第4の簡略化構成では、バイパス処理によりcoeff_abs_levelおよびcoeff_abs_level_minus1を復号したが、第5の簡略化構成ではcoeff_abs_levelの先頭ビットについてコンテキストを用いて復号を行い、coeff_abs_levelの先頭ビットより後ろのビットについてはバイパスによって復号する。なお、coeff_abs_level_minus1は全てバイパスによって復号しても良いし、先頭ビットのみをコンテキストを用いても良い。
図71は、coeff_abs_levelの先頭ビットのみをバイパスにする値のバイナリ構成を説明するための図である。図71に示すように、係数値復号部Y125は、変換係数の値をバイナリ化した場合の先頭ビットでコンテキストを用いる。ここで、より具体的にはcoeff_abs_levelの先頭ビットはsignificant_coeff_flagに相当することから、コンテキストインデックスの導出方法は既に説明した各種方法を用いることができる。
なお、coeff_abs_levelの先頭ビットを常にコンテキストを用いて復号する必要はない。より具体的には、係数値復号部Y125において、既に説明した処理により、significant_coeff_flag_modeを導出するようにし、significant_coeff_flag_modeの値が0の場合にはコンテキストを用いて復号し、値が1の場合にはバイパスで復号するように切り替えても良い。
以上、第5の構成の符号化データおよび本符号化データを復号する量子化残差情報復号部によれば、変換係数の絶対値であるcoeff_abs_levelの先頭ビットをコンテキストを用いることに高いスループットと高い符号化効率を両立させることができる。
(動画像符号化装置4)
以下では、本実施形態に係るさらなる他の動画像符号化装置である動画像符号化装置4について図74を参照して説明する。以下では、既に説明した部分と同じ部分については同じ符号を付し、その説明を省略する。
動画像符号化装置4は、動画像符号化装置1において、量子化残差情報符号化部271の代わりに量子化残差情報符号化部Y271を用いる。
(量子化残差情報符号化部Y271)
図74は、量子化残差情報符号化部Y271の構成を示すブロック図である。図74に示すように、量子化残差情報符号化部Y271は、変換係数符号化部Y220及び算術符号符号化部230を備えている。
(変換係数符号化部Y220)
図74に示すように、変換係数符号化部Y220は、ラスト位置符号化部221、スキャン順テーブル格納部222、係数符号化制御部223、係数有無フラグ符号化部Y224、係数値符号化部Y225、符号化係数記憶部226、サブブロック係数有無フラグY227、及びシンタックス導出部Y228を備えている。
(シンタックス導出部Y228)
シンタックス導出部Y228は、変換係数Coeff(xC、yC)の各値を参照し、対象周波数領域におけるこれらの変換係数を特定するためのシンタックスlast_significant_coeff_x、last_significant_coeff_y、significant_coeff_flag、coeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、及びcoeff_abs_level_minus3の各値を導出する。導出された各シンタックスは、符号化係数記憶部226に供給される。また、導出されたシンタックスのうちlast_significant_coeff_x、last_significant_coeff_yは、係数符号化制御部223及びラスト位置符号化部221にも供給される。また、導出されたシンタックスのうちsignificant_coeff_flagは、係数有無フラグ符号化部Y224にも供給される。なお、各シンタックスが示す内容については上述したためここでは説明を省略する。
(スキャン順テーブル格納部222)
スキャン順テーブル格納部222には、処理対象のTU(ブロック)のサイズ、スキャン方向の種別を表すスキャンインデックス、及びスキャン順に沿って付与された周波数成分識別インデックスを引数として、処理対象の周波数成分の周波数領域における位置を与えるテーブルが格納されている。このようなスキャン順テーブルの一例としては、図4及び図5に示したScanOrderが挙げられる。
また、スキャン順テーブル格納部222には、サブブロックのスキャン順を指定するためのサブブロックスキャン順テーブルが格納されている。ここで、サブブロックスキャン順テーブルは、処理対象のTU(ブロック)のサイズとイントラ予測モードの予測モードインデックスとに関連付けられたスキャンインデックスscanIndexによって指定される。
(係数符号化制御部223)
係数符号化制御部223は、量子化残差情報符号化部Y271の備える各部における符号化処理の順序を制御するための構成である。
(ブロックサイズが所定のサイズ以下である場合)
ブロックサイズが所定のサイズ以下(例えば4×4成分、8×8成分等)である場合、係数符号化制御部223は、シンタックス導出部228より供給されるシンタックスlast_significant_coeff_x及びlast_significant_coeff_yを参照し、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、特定した最後の非0変換係数の位置を起点とするスキャン順であって、スキャン順テーブル格納部222に格納されたスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、各周波数成分の位置(xC、yC)を、係数有無フラグ符号化部に供給する。
また、係数符号化制御部223は、処理対象のTUのサイズ、すなわち、対象周波数領域のサイズを示すパラメータであるszを、変換係数符号化部Y220の備える各部に供給する(図示省略)。ここで、szは、具体的には、処理対象TUの一辺の画素数、すなわち、対象周波数領域の一辺の周波数成分の数を表すパラメータである。
なお、係数符号化制御部223は、スキャン順テーブル格納部222に格納されたスキャン順テーブルよって与えられるスキャン順の順スキャン順に、各周波数成分の位置(xC、yC)を、係数有無フラグ符号化部Y224に供給する構成としてもよい。
(ブロックサイズが所定のサイズよりも大きい場合)
ブロックサイズが所定のサイズよりも大きい場合、係数符号化制御部223は、シンタックス導出部Y228から供給されるシンタックスlast_significant_coeff_x及びlast_significant_coeff_yを参照し、順スキャンに沿った最後の非0変換係数の位置を特定すると共に、特定した最後の非0変換係数を含むサブブロックの位置を起点とするスキャン順であって、スキャン順テーブル格納部222に格納されたサブブロックスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、各サブブロックの位置(xCG、yCG)を、サブブロック係数有無フラグ符号化部Y227に供給する。
また、係数符号化制御部223は、処理対象となるサブブロックに関して、スキャン順テーブル格納部222に格納されたスキャン順テーブルよって与えられるスキャン順の逆スキャン順に、当該処理対象となるサブブロックに含まれる各周波数成分の位置(xC、yC)を、係数有無フラグ符号化部Y224に供給する。ここで、処理対象となるサブブロックに含まれる各周波数成分のスキャン順としては、具体的には、斜め方向スキャン(Up-right diagonal scan)を用いればよい。
このように、係数符号化制御部223は、イントラ予測モード毎に、スキャン順を切り替える構成である。一般に、イントラ予測モードと変換係数の偏りとは互いに相関を有しているため、イントラ予測モードに応じてスキャン順を切り替えることにより、サブブロック係数有無フラグの偏りに適したサブブロックスキャンを行うことができる。これによって、符号化及び復号対象となるサブブロック係数有無フラグの符号量を削減することができ、符号化効率が向上する。
(係数値符号化部Y225)
係数値符号化部Y225では、通常処理を行う場合と簡略化処理を行う場合で処理が異なる。通常処理を行う場合には、シンタックス導出部Y228から供給されるシンタックスcoeff_abs_level_greater1_flag、coeff_abs_level_greater2_flag、coeff_sign_flag、及びcoeff_abs_level_minus3を示すBinを生成する。動画像復号装置3で説明した通り、簡略化処理を行う場合には、第1〜第3の簡略化構成では、coeff_sign_flag、及びcoeff_abs_level_minus1を示すBinを生成する。第4〜第5の簡略化構成では、coeff_sign_flag、及びcoeff_abs_level_minus1、coeff_abs_levelを示すBinを生成する。
また、生成した各Binをビット符号化部232に供給する。また、これらのシンタックスのBinを符号化するために参照されるコンテキストを指定するコンテキストインデックスctxIdxを、コンテキスト記録更新部231に供給する。なお、簡略化処理を行う場合には、コンテキストインデックスの導出を省略する。
(係数有無フラグ符号化部Y224)
本実施形態に係る係数有無フラグ符号化部Y224は、各位置(xC、yC)によって指定されるシンタックスsignificant_coeff_flag[xC][yC]を符号化する。より具体的には、各位置(xC、yC)によって指定されるシンタックスsignificant_coeff_flag[xC][yC]を示すBinを生成する。生成された各Binは、ビット符号化部232に供給される。また、係数有無フラグ符号化部224は、算術符号符号化部230にてシンタックスsignificant_coeff_flag[xC][yC]のBinを符号化するために用いられるコンテキストを決定するためのコンテキストインデックスctxIdxを算出する。算出されたコンテキストインデックスctxIdxは、コンテキスト記録更新部231に供給される。
但し、動画像復号装置3で説明した通り、第1の簡略化構成〜第3の簡略化構成において、通常処理においてはsignificant_coeff_flagのコンテキストインデックスを導出するが、簡略化処理においてバイパスを用いる場合には、コンテキストインデックスの導出は行わない。
図75は、係数有無フラグ符号化部Y224の構成を示すブロック図である。図75に示すように、係数有無フラグ符号化部Y224は、周波数分類部224a、位置コンテキスト導出部224b、周辺参照コンテキスト導出部224c、係数有無フラグ記憶部224d、及び、係数有無フラグ設定部224eを備えている。
周波数分類部224a、周辺参照コンテキスト導出部224c、係数有無フラグ記憶部224dによる具体的な処理は、動画像復号装置3の備える手段と同様であるので、ここでは説明を省略する。
(係数有無フラグ設定部224e)
係数有無フラグ設定部224eは、シンタックス導出部Y228から供給されるシンタックスsignificant_coeff_flag[xC][yC]を示すBinを生成する。生成したBinは、ビット符号化部232に供給される。また、係数有無フラグ設定部224eは、対象サブブロックに含まれるsignificant_coeff_flag[xC][yC]の値を参照し、対象サブブロックに含まれる全てのsignificant_coeff_flag[xC][yC]が0である場合、すなわち、当該対象サブブロックに非0変換係数が含まれていない場合に、当該対象サブブロックに関するsignificant_coeffgroup_flag[xCG][yCG]の値を0に設定し、そうでない場合に当該対象サブブロックに関するsignificant_coeffgroup_flag[xCG][yCG]の値を1に設定する。このように値が付されたsignificant_coeffgroup_flag[xCG][yCG]は、サブブロック係数有無フラグ符号化部Y227に供給される。
以上の構成によれば、簡略化処理を行う場合において、コンテキスト導出処理およびコンデキストの更新処理を省略することができるのでスループットを向上することができる。また、CAVLCのバイナリ化を用いる非特許文献2ではランモードとレベルモードの2つのモードを用いるのに対し、本実施形態の構成では1つのバイナリ化で簡略化処理が可能であるため、処理の構成が単純になるという効果を奏する。特にスループットが課題となる高ビットレートの領域では、変換係数が0となる割合が相対的に低下することから、ランモードと同様の符号化効率をレベルモードで実現できるという知見が有る。本構成では連続する0係数の数を符号化するランモードを用いず、レベルモードに相当する値を直接符号化するモードのみを用いるため、符号化効率を保ちながら、装置構成の複雑度を低下させることができる。
(付記事項1)
上述した動画像符号化装置2及び動画像復号装置1は、動画像の送信、受信、記録、再生を行う各種装置に搭載して利用することができる。なお、動画像は、カメラ等により撮像された自然動画像であってもよいし、コンピュータ等により生成された人工動画像(CGおよびGUIを含む)であってもよい。
まず、上述した動画像符号化装置2及び動画像復号装置1を、動画像の送信及び受信に利用できることを、図29を参照して説明する。
図29の(a)は、動画像符号化装置2を搭載した送信装置PROD_Aの構成を示したブロック図である。図29の(a)に示すように、送信装置PROD_Aは、動画像を符号化することによって符号化データを得る符号化部PROD_A1と、符号化部PROD_A1が得た符号化データで搬送波を変調することによって変調信号を得る変調部PROD_A2と、変調部PROD_A2が得た変調信号を送信する送信部PROD_A3と、を備えている。上述した動画像符号化装置2は、この符号化部PROD_A1として利用される。
送信装置PROD_Aは、符号化部PROD_A1に入力する動画像の供給源として、動画像を撮像するカメラPROD_A4、動画像を記録した記録媒体PROD_A5、動画像を外部から入力するための入力端子PROD_A6、及び、画像を生成または加工する画像処理部A7を更に備えていてもよい。図29の(a)においては、これら全てを送信装置PROD_Aが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_A5は、符号化されていない動画像を記録したものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化された動画像を記録したものであってもよい。後者の場合、記録媒体PROD_A5と符号化部PROD_A1との間に、記録媒体PROD_A5から読み出した符号化データを記録用の符号化方式に従って復号する復号部(不図示)を介在させるとよい。
図29の(b)は、動画像復号装置1を搭載した受信装置PROD_Bの構成を示したブロック図である。図29の(b)に示すように、受信装置PROD_Bは、変調信号を受信する受信部PROD_B1と、受信部PROD_B1が受信した変調信号を復調することによって符号化データを得る復調部PROD_B2と、復調部PROD_B2が得た符号化データを復号することによって動画像を得る復号部PROD_B3と、を備えている。上述した動画像復号装置1は、この復号部PROD_B3として利用される。
受信装置PROD_Bは、復号部PROD_B3が出力する動画像の供給先として、動画像を表示するディスプレイPROD_B4、動画像を記録するための記録媒体PROD_B5、及び、動画像を外部に出力するための出力端子PROD_B6を更に備えていてもよい。図29の(b)においては、これら全てを受信装置PROD_Bが備えた構成を例示しているが、一部を省略しても構わない。
なお、記録媒体PROD_B5は、符号化されていない動画像を記録するためのものであってもよいし、伝送用の符号化方式とは異なる記録用の符号化方式で符号化されたものであってもよい。後者の場合、復号部PROD_B3と記録媒体PROD_B5との間に、復号部PROD_B3から取得した動画像を記録用の符号化方式に従って符号化する符号化部(不図示)を介在させるとよい。
なお、変調信号を伝送する伝送媒体は、無線であってもよいし、有線であってもよい。また、変調信号を伝送する伝送態様は、放送(ここでは、送信先が予め特定されていない送信態様を指す)であってもよいし、通信(ここでは、送信先が予め特定されている送信態様を指す)であってもよい。すなわち、変調信号の伝送は、無線放送、有線放送、無線通信、及び有線通信の何れによって実現してもよい。
例えば、地上デジタル放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を無線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。また、ケーブルテレビ放送の放送局(放送設備など)/受信局(テレビジョン受像機など)は、変調信号を有線放送で送受信する送信装置PROD_A/受信装置PROD_Bの一例である。
また、インターネットを用いたVOD(Video On Demand)サービスや動画共有サービスなどのサーバ(ワークステーションなど)/クライアント(テレビジョン受像機、パーソナルコンピュータ、スマートフォンなど)は、変調信号を通信で送受信する送信装置PROD_A/受信装置PROD_Bの一例である(通常、LANにおいては伝送媒体として無線又は有線の何れかが用いられ、WANにおいては伝送媒体として有線が用いられる)。ここで、パーソナルコンピュータには、デスクトップ型PC、ラップトップ型PC、及びタブレット型PCが含まれる。また、スマートフォンには、多機能携帯電話端末も含まれる。
なお、動画共有サービスのクライアントは、サーバからダウンロードした符号化データを復号してディスプレイに表示する機能に加え、カメラで撮像した動画像を符号化してサーバにアップロードする機能を有している。すなわち、動画共有サービスのクライアントは、送信装置PROD_A及び受信装置PROD_Bの双方として機能する。
次に、上述した動画像符号化装置2及び動画像復号装置1を、動画像の記録及び再生に利用できることを、図30を参照して説明する。
図30の(a)は、上述した動画像符号化装置2を搭載した記録装置PROD_Cの構成を示したブロック図である。図30の(a)に示すように、記録装置PROD_Cは、動画像を符号化することによって符号化データを得る符号化部PROD_C1と、符号化部PROD_C1が得た符号化データを記録媒体PROD_Mに書き込む書込部PROD_C2と、を備えている。上述した動画像符号化装置2は、この符号化部PROD_C1として利用される。
なお、記録媒体PROD_Mは、(1)HDD(Hard Disk Drive)やSSD(Solid State Drive)などのように、記録装置PROD_Cに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSB(Universal Serial Bus)フラッシュメモリなどのように、記録装置PROD_Cに接続されるタイプのものであってもよいし、(3)DVD(Digital Versatile Disc)やBD(Blu-ray Disc:登録商標)などのように、記録装置PROD_Cに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、記録装置PROD_Cは、符号化部PROD_C1に入力する動画像の供給源として、動画像を撮像するカメラPROD_C3、動画像を外部から入力するための入力端子PROD_C4、動画像を受信するための受信部PROD_C5、及び、画像を生成または加工する画像処理部C6を更に備えていてもよい。図30の(a)においては、これら全てを記録装置PROD_Cが備えた構成を例示しているが、一部を省略しても構わない。
なお、受信部PROD_C5は、符号化されていない動画像を受信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを受信するものであってもよい。後者の場合、受信部PROD_C5と符号化部PROD_C1との間に、伝送用の符号化方式で符号化された符号化データを復号する伝送用復号部(不図示)を介在させるとよい。
このような記録装置PROD_Cとしては、例えば、DVDレコーダ、BDレコーダ、HDD(Hard Disk Drive)レコーダなどが挙げられる(この場合、入力端子PROD_C4又は受信部PROD_C5が動画像の主な供給源となる)。また、カムコーダ(この場合、カメラPROD_C3が動画像の主な供給源となる)、パーソナルコンピュータ(この場合、受信部PROD_C5又は画像処理部C6が動画像の主な供給源となる)、スマートフォン(この場合、カメラPROD_C3又は受信部PROD_C5が動画像の主な供給源となる)なども、このような記録装置PROD_Cの一例である。
図30の(b)は、上述した動画像復号装置1を搭載した再生装置PROD_Dの構成を示したブロックである。図30の(b)に示すように、再生装置PROD_Dは、記録媒体PROD_Mに書き込まれた符号化データを読み出す読出部PROD_D1と、読出部PROD_D1が読み出した符号化データを復号することによって動画像を得る復号部PROD_D2と、を備えている。上述した動画像復号装置1は、この復号部PROD_D2として利用される。
なお、記録媒体PROD_Mは、(1)HDDやSSDなどのように、再生装置PROD_Dに内蔵されるタイプのものであってもよいし、(2)SDメモリカードやUSBフラッシュメモリなどのように、再生装置PROD_Dに接続されるタイプのものであってもよいし、(3)DVDやBDなどのように、再生装置PROD_Dに内蔵されたドライブ装置(不図示)に装填されるものであってもよい。
また、再生装置PROD_Dは、復号部PROD_D2が出力する動画像の供給先として、動画像を表示するディスプレイPROD_D3、動画像を外部に出力するための出力端子PROD_D4、及び、動画像を送信する送信部PROD_D5を更に備えていてもよい。図30の(b)においては、これら全てを再生装置PROD_Dが備えた構成を例示しているが、一部を省略しても構わない。
なお、送信部PROD_D5は、符号化されていない動画像を送信するものであってもよいし、記録用の符号化方式とは異なる伝送用の符号化方式で符号化された符号化データを送信するものであってもよい。後者の場合、復号部PROD_D2と送信部PROD_D5との間に、動画像を伝送用の符号化方式で符号化する符号化部(不図示)を介在させるとよい。
このような再生装置PROD_Dとしては、例えば、DVDプレイヤ、BDプレイヤ、HDDプレイヤなどが挙げられる(この場合、テレビジョン受像機等が接続される出力端子PROD_D4が動画像の主な供給先となる)。また、テレビジョン受像機(この場合、ディスプレイPROD_D3が動画像の主な供給先となる)、デジタルサイネージ(電子看板や電子掲示板等とも称され、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、デスクトップ型PC(この場合、出力端子PROD_D4又は送信部PROD_D5が動画像の主な供給先となる)、ラップトップ型又はタブレット型PC(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)、スマートフォン(この場合、ディスプレイPROD_D3又は送信部PROD_D5が動画像の主な供給先となる)なども、このような再生装置PROD_Dの一例である。
(付記事項2)
上述した動画像復号装置1、および動画像符号化装置2の各ブロックは、集積回路(ICチップ)上に形成された論理回路によってハードウェア的に実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェア的に実現してもよい。
後者の場合、上記各装置は、各機能を実現するプログラムの命令を実行するCPU、上記プログラムを格納したROM(Read Only Memory)、上記プログラムを展開するRAM(Random Access Memory)、上記プログラムおよび各種データを格納するメモリ等の記憶装置(記録媒体)などを備えている。そして、本発明の目的は、上述した機能を実現するソフトウェアである上記各装置の制御プログラムのプログラムコード(実行形式プログラム、中間コードプログラム、ソースプログラム)をコンピュータで読み取り可能に記録した記録媒体を、上記各装置に供給し、そのコンピュータ(またはCPUやMPU)が記録媒体に記録されているプログラムコードを読み出し実行することによっても、達成可能である。
上記記録媒体としては、例えば、磁気テープやカセットテープ等のテープ類、フロッピー(登録商標)ディスク/ハードディスク等の磁気ディスクやCD−ROM/MO/MD/DVD/CD−R等の光ディスクを含むディスク類、ICカード(メモリカードを含む)/光カード等のカード類、マスクROM/EPROM/EEPROM(登録商標)/フラッシュROM等の半導体メモリ類、あるいはPLD(Programmable logic device)やFPGA(Field Programmable Gate Array)等の論理回路類などを用いることができる。
また、上記各装置を通信ネットワークと接続可能に構成し、上記プログラムコードを通信ネットワークを介して供給してもよい。この通信ネットワークは、プログラムコードを伝送可能であればよく、特に限定されない。例えば、インターネット、イントラネット、エキストラネット、LAN、ISDN、VAN、CATV通信網、仮想専用網(Virtual Private Network)、電話回線網、移動体通信網、衛星通信網等が利用可能である。また、この通信ネットワークを構成する伝送媒体も、プログラムコードを伝送可能な媒体であればよく、特定の構成または種類のものに限定されない。例えば、IEEE1394、USB、電力線搬送、ケーブルTV回線、電話線、ADSL(Asymmetric Digital Subscriber Line)回線等の有線でも、IrDAやリモコンのような赤外線、Bluetooth(登録商標)、IEEE802.11無線、HDR(High Data Rate)、NFC(Near Field Communication)、DLNA(登録商標)(Digital Living Network Alliance)、携帯電話網、衛星回線、地上波デジタル網等の無線でも利用可能である。
<本明細書に記載された発明(A)>
本明細書には、少なくとも以下の発明が記載されている。
A1.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出する、
ことを特徴とする算術復号装置。
A2.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
上記コンテキストインデックス導出手段は、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出するものであり、
上記複数の部分領域のうち高周波数側の部分領域において設定される上記参照領域は、低周波数側の部分領域において設定される上記参照領域よりも小さい、
ことを特徴とする算術復号装置。
A3.
上記コンテキストインデックス導出手段は、上記部分領域毎に定まる所定の開始点と、上記部分領域毎に定まる変数とを加算することによってコンテキストインデックスを導出するものであり、上記変数の導出方法の異なる複数の部分領域について、開始点を同じ値に設定することにより、コンデキストインデックスの導出方法の異なる当該複数の部分領域において、共通のコンテキストを用いるものであることを特徴とするA2.に記載の算術復号装置。
A4.
上記分割手段は、上記対象周波数領域を、処理対象の変換係数有無フラグの位置に応じて、少なくとも3つの部分領域に分類するものであり、上記コンテキストインデックス導出手段は、第1の部分領域では、復号済みの非0変換係数をN1個(N1は自然数)参照し、第2の部分領域では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、第3の部分領域では、変換係数有無フラグの位置に応じて、コンテキストインデックスを導出することを特徴とするA1.からA3.の何れか1項に記載の算術復号装置。
A5.
上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数に更に基づいて導出する、
ことを特徴とするA2.に記載の算術復号装置。
A6.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを各スキャン列に沿って順次導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数に基づいて導出する、
ことを特徴とする算術復号装置。
A7.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
上記コンテキストインデックス導出手段は、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出するものであり、
上記参照領域に含まれる復号済みの変換係数の数は、4以下である、
ことを特徴とする算術復号装置。
A8.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、
各部分領域に対して、互いに異なるコンテキストインデックスを割り付けるコンテキストインデックス割り付け手段と、
各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグを、該変換係数有無フラグが属する部分領域に割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
上記複数の部分領域のうち低周波数側の部分領域は、高周波数側の部分領域よりも小さい、
ことを特徴とする算術復号装置。
A9.
上記分割手段は、変換係数有無フラグのX座標とY座標のと和を示すSUMに応じて、上記対象周波数領域を、複数の部分領域に分割するものであり、上記分割手段は、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第1の閾値TH2との大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域に分割し、第1の閾値TH2がsz以上であることを特徴とするA1.に記載の算術復号装置。
A10.
上記分割手段は、変換係数有無フラグのX座標とY座標のと和を示すSUMに応じて、上記対象周波数領域を、複数の部分領域に分割するものであり、上記分割手段は、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第1の閾値TH2との大小関係に応じて、上記対象周波数領域を、少なくとも上記低周波数側の部分領域と上記高周波数側の部分領域に分割し、第1の閾値TH2がsz−2以下であることを特徴とするA2.に記載の算術復号装置。
A11.
上記分割手段は、変換係数有無フラグのX座標とY座標のと和を示すSUMに応じて、上記対象周波数領域を、複数の部分領域に分割するものであり、上記分割手段は、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第1の閾値TH2との大小関係に応じて、上記対象周波数領域を、上記第1の部分領域と上記第2の部分領域に分割し、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第2の閾値TH3との大小関係に応じて、上記対象周波数領域を、上記第2の部分領域と上記第3の部分領域に分割し、上記第1の閾値TH2がsz−2以下であり、上記第2の閾値TH3がsz以上であることを特徴とするA4.に記載の算術復号装置。
A12.
A1.からA11.の何れか1項に記載の算術復号装置と、
上記算術復号装置によって復号された変換係数を逆周波数変換することによって残差画像を生成する逆周波数変換手段と、
上記逆周波数変換手段によって生成された残差画像と、生成済みの復号画像から予測された予測画像とを加算することによって復号画像を生成する復号画像生成手段と、
を備えていることを特徴とする画像復号装置。
A13.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって符号化データを生成する算術符号化装置であって、
処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術符号化するシンタックス符号化手段と、
を備え、
上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出する、
ことを特徴とする算術符号化装置。
A14.
符号化対象画像と予測画像との残差画像を単位領域毎に周波数変換することによって変換係数を生成する変換係数生成手段と、
A13.に記載の算術符号化装置と、
を備えており、
上記算術符号化装置は、上記変換係数生成手段によって生成された変換係数を表す各種のシンタックスを算術符号化することによって符号化データを生成するものである、
ことを特徴とする画像符号化装置。
A15.
対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られる符号化データのデータ構造であって、
各単位領域に対応する各対象周波数領域における高周波数側の変換係数を復号するか否かを示す制限フラグを含み、
上記符号化データを復号する算術復号装置は、上記制限フラグが、高周波数側の変換係数を復号しないことを示している場合には、当該高周波数側の変換係数を復号しない、
ことを特徴とする符号化データのデータ構造。
<本明細書に記載された発明(B)>
また、本明細書には、少なくとも以下の発明が記載されている。
B1.
対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、
上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段と、
対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出し、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、
を特徴とする算術復号装置。
B2.
上記分割手段は、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THAとの大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域とに分割するものであり、
上記対象周波数領域の各辺に沿った周波数成分の数をszと表すとき、上記閾値THAは、sz/16以上の値を有する
ことを特徴とするB1.に記載の算術復号装置。
B3.
対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、
上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段と、
対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側および低周波数側の何れかの部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの属するサブブロックの位置に基づいて選択された高周波数側用の参照領域および低周波数側用の参照領域のいずれかの参照領域であって、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済の非0変換係数の数に基づいて導出し、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、
を特徴とする算術復号装置。
B4.
対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、
処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、
上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段と、
対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、
を備え、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済の非0変換係数であって、処理順で該変換係数有無フラグの直前に復号された非0変換係数を除く非0変換係数の数に基づいて導出し、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、
を特徴とする算術復号装置。
B5.
上記分割手段は、上記対象周波数領域を少なくとも3つの部分領域に分割するものであり、上記コンテキストインデックス導出手段は、第1の部分領域では、復号済みの非0変換係数をN1個(N1は自然数)参照し、第2の部分領域では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、第3の部分領域では、変換係数有無フラグの位置に応じて、コンテキストインデックスを導出することを特徴とするB3.またはB4.に記載の算術復号装置。
B6.
上記分割手段は、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THBとの大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域とに分割するものであり、
上記対象周波数領域の各辺に沿った周波数成分の数をszと表すとき、上記閾値THBは、sz/4以下の値を有する
ことを特徴とするB3.に記載の算術復号装置。
B7.
上記分割手段は、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THBとの大小関係に応じて、上記対象周波数領域を、上記第1の部分領域と上記第2の部分領域とに分割すると共に、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THCとの大小関係に応じて、上記対象周波数領域を、上記第2の部分領域と上記第3の部分領域とに分割するものであり、
上記対象周波数領域の各辺に沿った周波数成分の数をszと表すとき、上記閾値THBは、sz/4以下の値を有し、上記閾値THCは、(sz/4)+2以上の値を有する
ことを特徴とするB5.に記載の算術復号装置。
B8.
B1.からB7.の何れか1項に記載の算術復号装置と、
上記算術復号装置によって復号された変換係数を逆周波数変換することによって残差画像を生成する逆周波数変換手段と、
上記逆周波数変換手段によって生成された残差画像と、生成済みの復号画像から予測された予測画像とを加算することによって復号画像を生成する復号画像生成手段と、
を備えていることを特徴とする画像復号装置。
B9.
対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって符号化データを生成する算術符号化装置であって、
処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、
上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを符号化するサブブロック係数有無フラグ符号化手段と、
対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、
各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、
各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術符号化するシンタックス符号化手段と、
を備え、
対象サブブロックについて符号化されるサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出し、
対象サブブロックについて符号化されるサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして符号化処理を行う、
を特徴とする算術符号化装置。
B10.
符号化対象画像と予測画像との残差画像を単位領域毎に周波数変換することによって変換係数を生成する変換係数生成手段と、
B9.に記載の算術符号化装置と、
を備えており、
上記算術符号化装置は、上記変換係数生成手段によって生成された変換係数を表す各種のシンタックスを算術符号化することによって符号化データを生成するものである、
ことを特徴とする画像符号化装置。
B11.
対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られる符号化データのデータ構造であって、
上記単位領域に対応する周波数領域を分割して得られた所定サイズの各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを含み、
上記符号化データを復号する復号装置は、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出すると共に、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号し、
対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、
ことを特徴とする符号化データのデータ構造。
<本明細書に記載された発明(C)>
また、本明細書には、少なくとも以下の発明が記載されている。
C1.
本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段と、対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出し、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、ことを特徴としている。
上記のように構成された算術復号装置によれば、対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出するので、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
また、上記の構成によれば、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行うので、サブブロック係数有無フラグを用いない構成に比べて、変換係数を復号するための処理量が削減される。
C2.
上記分割手段は、上記対象周波数領域を少なくとも低周波数側と高周波数側の2つの部分領域に分割するものであり、上記コンテキストインデックス導出手段は、低周波数側に属する部分領域の少なくとも1つでは、復号済みの非0変換係数を参照することによって、コンテキストインデックスを導出し、高周波数側に属する部分領域では、周波数領域上の位置に基づく値、または固定的な所定の値をコンテキストインデックスとして導出することが好ましい。
上記構成によれば、低周波数側に属する部分領域の少なくとも1つでは、復号済みの非0変換係数を参照することによって、コンテキストインデックスを導出し、高周波数側に属する部分領域では、周波数領域上の位置に基づく値、または固定的な所定の値をコンテキストインデックスとして導出するので、高い符号化効率を保ちつつ、処理量を削減することができる。
C3.
また、上記算術復号装置において、上記コンテキストインデックス導出手段により導出される、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲内であることが好ましい。
上記構成によれば、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲内にあるので、コンテキストインデックスを導出するための処理量が削減される。
C4.
また、上記算術復号装置において、上記コンテキストインデックス導出手段により導出される、輝度に関するコンテキストインデックスであって、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲以外の値であり、上記コンテキストインデックス導出手段により導出される、色差に関するコンテキストインデックスであって、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲内であることが好ましい。
上記の構成によれば、色差に関するコンテキストインデックスであって、高周波数側に属する部分領域で用いるコンテキストインデックスの値が、低周波数側に属する部分領域で用いるコンテキストインデックスの範囲内であるので、色差に関するコンテキストインデックスを導出するための処理量が削減される。
C5.
また、上記分割手段は、上記対象周波数領域を少なくとも低周波数側と高周波数側の2つの部分領域に分割するものであり、上記コンテキストインデックス導出手段は、低周波数側に属する部分領域の少なくとも1つにおいて、N1(N1は自然数)個以上の復号済みの非0変換係数を参照することによって、コンテキストインデックスを導出し、高周波数側に属する部分領域において、N2個(N2はN2<N1を満たす自然数)の復号済みの非0変換係数を参照することによって、コンテキストインデックスを導出することが好ましい。
上記の構成によれば、高周波数側に属する部分領域において参照する復号済みの非0変換係数の数が、低周波数側に属する部分領域の少なくとも1つにおいて参照する復号済みの非0変換係数の数よりも小さいので、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C6.
また、上記コンテキストインデックス導出手段は、低周波数側に属する部分領域では、復号済みの非0変換係数の数を多対一変換することによってコンテキストインデックスを導出し、高周波数側に属する部分領域では、非0変換係数の数をコンテキストインデックスとして導出することが好ましい。
上記の構成によれば、高周波数側に属する部分領域では、非0変換係数の数を多対一変換する処理を行わずにコンテキストインデックスを導出するので、処理量が削減される。
C7.
また、上記分割手段は、変換係数有無フラグのX座標及びY座標の和、もしくは、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域の幅及び高さの最大値で得られるサイズに応じて定まる閾値THAとの大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域とに分割するものであり、上記対象周波数領域のサイズをszと表すとき、上記閾値THAは、X座標及びY座標の和である場合にはsz以下の値、サブブロックのX座標及びY座標の和である場合には、sz/サブブロックの大きさ以下の値であることが好ましい。
上記の構成によれば、変換係数有無フラグのX座標及びY座標の和、もしくは、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域の幅及び高さの最大値で得られるサイズに応じて定まる閾値THAとの大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域とに分割するものであり、上記対象周波数領域のサイズをszと表すとき、上記閾値THAは、X座標及びY座標の和である場合にはsz以下の値、サブブロックのX座標及びY座標の和である場合には、sz/サブブロックの大きさ以下の値であるので、高い符号化効率を保ちつつ、処理量を削減することができる。
また、上記算術復号装置において、上記分割手段は、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THAとの大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域とに分割するものであり、上記対象周波数領域の各辺に沿った周波数成分の数をszと表すとき、上記閾値THAは、sz/16以上の値を有することが好ましい。
上記の構成によれば、対象周波数領域を、高符号化効率及び処理量削減のために好適に分割することができる。
C8.
本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段と、対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側および低周波数側の何れかの部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの属するサブブロックの位置に基づいて選択された高周波数側用の参照領域および低周波数側用の参照領域のいずれかの参照領域であって、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済の非0変換係数の数に基づいて導出し、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、ことを特徴としている。
上記のように構成された算術復号装置によれば、対象サブブロックが、対象周波数領域において高周波数側および低周波数側の何れかの部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済の非0変換係数の数に基づいて導出するので、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
また、上記の構成によれば、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行うので、サブブロック係数有無フラグを用いない構成に比べて、変換係数を復号するための処理量が削減される。
C9.
本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段と、対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済の非0変換係数であって、処理順で該変換係数有無フラグの直前に復号された非0変換係数を除く非0変換係数の数に基づいて導出し、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、ことを特徴としている。
上記のように構成された算術復号装置によれば、対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済の非0変換係数であって、処理順で該変換係数有無フラグの直前に復号された非0変換係数を除く非0変換係数の数に基づいて導出するので、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
また、上記の構成によれば、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行うので、サブブロック係数有無フラグを用いない構成に比べて、変換係数を復号するための処理量が削減される。
C10.
また、上記算術復号装置において、上記分割手段は、上記対象周波数領域を少なくとも3つの部分領域に分割するものであり、上記コンテキストインデックス導出手段は、第1の部分領域では、復号済みの非0変換係数をN1個(N1は自然数)参照し、第2の部分領域では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、第3の部分領域では、変換係数有無フラグの位置に応じて、コンテキストインデックスを導出することが好ましい。
上記の構成によれば、コンテキストインデックスを参照するために参照する復号済みの非0変換係数の数がより小さく設定された部分領域と、対象周波数領域における該変換係数有無フラグの位置に基づいてコンテキストインデックスを導出する部分領域とを組み合わせることによって、高い符号化効率を実現しつつ、従来の構成に比べて、特に高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C11.
また、上記算術復号装置において、上記分割手段は、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THBとの大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域とに分割するものであり、上記対象周波数領域の各辺に沿った周波数成分の数をszと表すとき、上記閾値THBは、sz/4以下の値を有することが好ましい。
上記の構成によれば、対象周波数領域を、高符号化効率及び処理量削減のために好適に分割することができる。
C12.
また、上記算術復号装置において、上記分割手段は、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THBとの大小関係に応じて、上記対象周波数領域を、上記第1の部分領域と上記第2の部分領域とに分割すると共に、変換係数有無フラグの属するサブブロックのX座標及びY座標の和と、上記対象周波数領域のサイズに応じて定まる閾値THCとの大小関係に応じて、上記対象周波数領域を、上記第2の部分領域と上記第3の部分領域とに分割するものであり、上記対象周波数領域の各辺に沿った周波数成分の数をszと表すとき、上記閾値THBは、sz/4以下の値を有し、上記閾値THCは、(sz/4)+2以上の値を有することが好ましい。
上記の構成によれば、対象周波数領域を、高符号化効率及び処理量削減のために好適に分割することができる。
C13.
本発明の一態様に係る画像復号装置は、上記算術復号装置と、上記算術復号装置によって復号された変換係数を逆周波数変換することによって残差画像を生成する逆周波数変換手段と、上記逆周波数変換手段によって生成された残差画像と、生成済みの復号画像から予測された予測画像とを加算することによって復号画像を生成する復号画像生成手段と、を備えていることを特徴としている。
上記画像復号装置によれば、シンタックス導出のための処理量を削減しつつ、高い符号化効率にて符号化データを復号することができる。
C14.
本発明の一態様に係る算術符号化装置は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって符号化データを生成する算術符号化装置であって、処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを符号化するサブブロック係数有無フラグ符号化手段と、対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術符号化するシンタックス符号化手段と、を備え、対象サブブロックについて符号化されるサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出し、対象サブブロックについて符号化されるサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして符号化処理を行う、ことを特徴としている。
上記のように構成された算術符号化装置によれば、対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、上記コンテキストインデックス導出手段は、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出するので、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
また、上記の構成によれば、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして符号化処理を行うので、サブブロック係数有無フラグを用いない構成に比べて、変換係数を符号化するための処理量が削減される。
C15.
本発明の一態様に係る画像符号化装置は、符号化対象画像と予測画像との残差画像を単位領域毎に周波数変換することによって変換係数を生成する変換係数生成手段と、上記算術符号化装置と、を備えており、上記算術符号化装置は、上記変換係数生成手段によって生成された変換係数を表す各種のシンタックスを算術符号化することによって符号化データを生成するものである、ことを特徴としている。
上記画像符号化装置によれば、シンタックス導出のための処理量を削減しつつ、高い符号化効率の符号化データを生成することができる。
C16.
また、本発明の一態様に係る符号化データのデータ構造は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られる符号化データのデータ構造であって、上記単位領域に対応する周波数領域を分割して得られた所定サイズの各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを含み、上記符号化データを復号する復号装置は、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出すると共に、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号し、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行う、ことを特徴としている。
上記のように構成された符号化データは、上記単位領域に対応する周波数領域を分割して得られた所定サイズの各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを含み、上記符号化データを復号する復号装置は、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が少なくとも1つ含まれることを示している場合であって、当該対象サブブロックが、対象周波数領域において高周波数側の部分領域に属するものである場合、当該対象サブブロックに属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における当該対象サブブロックの位置に基づいて導出すると共に、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割りつけられたコンテキストインデックスによって指定される確率状態に基づいて算術復号し、対象サブブロックについて復号されたサブブロック係数有無フラグが、当該対象サブブロックに非0変換係数が含まれていないことを示している場合、当該対象サブブロックに属する全ての変換係数の各々についての変換係数有無フラグを、該変換係数が0であることを示すものとして復号処理を行うので、高い符号化効率を維持しつつ復号するための処理量を削減することができる。
C17.
また、本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、M1個(M1は自然数)のシンタックスを復号して各変換係数の値を復号する通常モードと、M2個(M2はM2<M1を満たす自然数)のシンタックスを復号して各変換係数の値を復号する簡略化モードとを選択的に用いることによって各変換係数の値を復号することを特徴としている。
上記の算術復号装置によれば、簡略化モードにおいて通常モードよりも少ないシンタックスを用いるため、復号処理のスループットを向上させることができる。
C18.
上記算術復号装置は、各シンタックスに割りつけられたコンテキストによって指定される確率状態に基づいた算術復号、及び、コンテキストを用いずに固定の確率状態に基づいた算術復号の何れかの算術復号によって、各シンタックスを復号するシンタックス復号手段を備え、上記シンタックス復号手段は、通常モードでは上記M1個のシンタックスについてコンテキストを用いて復号を行い、簡略化モードでは上記M2個のシンタックスについてコンテキストを用いて復号を行うことが好ましい。
上記の算術復号装置によれば、簡略化モードにおいて通常モードよりも少ないシンタックスに対してコンテキストを用いるため、コンテキスト導出およびコンテキストの更新に必要な処理を省略することができるため、復号処理のスループットを向上させることができる。
C19.
また、上記算術復号装置は、処理対象の単位領域に対応する対象周波数領域を所定サイズのサブブロックに分割するサブブロック分割手段と、上記サブブロック分割手段により分割された各サブブロックについて、該サブブロックに非0変換係数が少なくとも1つ含まれるか否かを表すサブブロック係数有無フラグを復号するサブブロック係数有無フラグ復号手段を備え、通常モードでは、上記サブブロック係数有無フラグと、変換係数が0である否かを示す変換係数有無フラグとをコンテキストを用いて復号し、簡略化モードでは、上記サブブロック係数有無フラグをコンテキストを用いて復号し、上記変換係数有無フラグをコンテキストを用いずに復号することが好ましい。
上記の算術復号装置によれば、発生頻度の低いシンタックスであるが、低い符号量に抑えることが重要になるサブブロック係数有無フラグsignificant_coeffgroup_flagに関しては、通常モードであるか簡略化モードであるか否かに関わらずコンテキストを用いるため、高い符号化効率を保ちながらスループットを向上させることができる。
C20.
また、上記算術復号装置は、通常モードにおいて、変換係数が0である否かを示す変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値が1より大きいか否かを示すシンタックスcoeff_abs_greater1_flag、変換係数の絶対値が2より大きいか否かを示すシンタックスcoeff_abs_greater2_flag、変換係数の絶対値から3を減算した値を示すシンタックスcoeff_abs_minus3、及び変換係数の符号を示すシンタックスcoeff_signを復号し、簡略化モードにおいて、上記変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値から1を減算した値を示すシンタックスcoeff_abs_minus1、及び変換係数の符号を示すシンタックスcoeff_signを復号することが好ましい。
上記の算術復号装置によれば、簡略化モードにおいて通常モードよりも少ないシンタックスを用いるため、復号処理のスループットを向上させることができる。
C21.
また、上記算術復号装置は、通常モードにおいて、上記変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値が1より大きいか否かを示す上記シンタックスcoeff_abs_greater1_flag、及び変換係数の絶対値が2より大きいか否かを示す上記シンタックスcoeff_abs_greater2_flagをコンテキストを用いて復号し、簡略化モードにおいて、上記変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値から1を減算した値を示す上記シンタックスcoeff_abs_minus1、及び変換係数の符号を示す上記シンタックスcoeff_signをコンテキストを用いずに復号することが好ましい。
上記の算術復号装置によれば、簡略化モードにおいてコンテキストを用いずに変換係数の値を構成するシンタックスを復号するため、復号処理のスループットを向上させることができる。
C22.
また、上記算術復号装置は、通常モードにおいて、上記変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値が1より大きいか否かを示す上記シンタックスcoeff_abs_greater1_flag、及び変換係数の絶対値が2より大きいか否かを示す上記シンタックスcoeff_abs_greater2_flagをコンテキストを用いて復号し、簡略化モードにおいて、変換係数の絶対値から1を減算した値を示す上記シンタックスcoeff_abs_minus1、及び変換係数の符号を示す上記シンタックスcoeff_signをコンテキストを用いずに復号することが好ましい。
上記の算術復号装置によれば、簡略化モードにおいてコンテキストを用いずに変換係数の値を構成するシンタックスの殆どを復号するため、復号処理のスループットを向上させることができる。
C23.
また、上記算術復号装置は、簡略化モードにおいて、変換係数の絶対値から1を減算した値を示す上記シンタックスcoeff_abs_minus1と、変換係数の符号を示す上記シンタックスcoeff_signとを連続して復号することが好ましい。
上記の算術復号装置によれば、簡略化モードにおいてコンテキストを用いずに復号するシンタックスを連続で配置するため、復号処理のスループットを向上させることができる。
C24.
また、上記算術復号装置は、通常モードにおいて、変換係数が0である否かを示す変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値が1より大きいか否かを示すシンタックスcoeff_abs_greater1_flag、変換係数の絶対値が2より大きいか否かを示すシンタックスcoeff_abs_greater2_flag、変換係数の絶対値から3を減算した値を示すシンタックスcoeff_abs_minus3、及び変換係数の符号を示すシンタックスcoeff_signを復号し、簡略化モードにおいて、変換係数の絶対値から1を減算した値を示すシンタックスcoeff_abs_minus1、変換係数の絶対値coeff_abs、及び変換係数の符号を示すシンタックスcoeff_signを復号することが好ましい。
上記の算術復号装置によれば、簡略化モードにおいて通常モードよりも少ないシンタックスを用いるため、復号処理のスループットを向上させることができる。
C25.
また、上記算術復号装置は、通常モードにおいて、上記変換係数有無フラグsignificant_coeff_flag、変換係数の絶対値が1より大きいか否かを示す上記シンタックスcoeff_abs_greater1_flag、及び変換係数の絶対値が2より大きいか否かを示す上記シンタックスcoeff_abs_greater2_flagをコンテキストを用いて復号し、簡略化モードにおいて、変換係数の絶対値から1を減算した値を示す上記シンタックスcoeff_abs_minus1、及び変換係数の符号を示すシンタックスcoeff_signをコンテキストを用いずに復号することが好ましい。
上記の算術復号装置によれば、簡略化モードにおいてコンテキストを用いずに変換係数の値を構成するシンタックスの殆どを復号するため、復号処理のスループットを向上させることができる。
C26.
また、上記算術復号装置は、変換係数のラスト位置のX座標及びY座標の和と、所定の閾値との大小比較に応じて、前記ラスト位置のX座標及びY座標の和の方が大きい場合に上記簡略化モードを選択し、それ以外の場合には、上記通常モードを選択することが好ましい。
上記の算術復号装置によれば、高スループットで処理する必要がある場合だけを判定して、簡略化モードを用いるため、高い符号化効率を保ちながら復号処理のスループットを向上させることができる。
C27.
また、上記算術復号装置は、前記ラスト位置のX座標及びY座標の和の方が多い場合に、それ以外の場合よりもコンテキストを用いて復号するシンタックスの数を減らすことが好ましい。
上記の算術復号装置によれば、高スループットで処理する必要がある場合を適切に判定することができるため、簡略化モードを用いるため、高い符号化効率を保ちながら復号処理のスループットを向上させることができる。
C28.
また、上記算術復号装置は、周波数領域の幅と高さとが同じ場合と、周波数領域の幅と高さとが異なる場合とにおいて、上記閾値として異なる値を用いることが好ましい。
上記の算術復号装置によれば、周波数領域の幅と高さが異なる場合においても、高スループットで処理する必要がある場合を適切に判定することができるため、簡略化モードを用いるため、高い符号化効率を保ちながら復号処理のスループットを向上させることができる。
C29.
また、上記算術復号装置は、対象周波数領域を、各周波数成分、及び、各サブブロックの少なくとも何れかを分割単位として複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0である否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段とを備え、あるサブブロックにおいて、変換係数有無フラグの数が所定の数以上である場合には、当該あるサブブロックの次に処理するサブブロックにおいてコンテストを用いずに変換係数有無フラグを復号することが好ましい。
上記の算術復号装置によれば、高スループットで処理する必要がある場合だけを判定して、簡略化モードを用いるため、高い符号化効率を保ちながら復号処理のスループットを向上させることができる。
C30.
また、本発明の一態様に係る算術符号化装置は、対象画像を単位領域毎に周波数変換することによって周波数成分毎に得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって符号化データを生成する算術符号化装置であって、M1個(M1は自然数)のシンタックスを用いて各変換係数の値を符号化する通常モードと、M2個(M2はM2<M1を満たす自然数)のシンタックスを用いて各変換係数の値を符号化する簡略化モードとを選択的に用いることによって各変換係数の値を符号化することを特徴としている。
上記の算術符号化装置によれば、簡略化モードにおいて通常モードよりも少ないシンタックスを用いるため、符号化及び復号処理のスループットを向上させることができる。
C31.
本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出する、ことを特徴としている。
上記のように構成された算術復号装置によれば、対象周波数領域における上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出するので、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C32.
また、本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、上記コンテキストインデックス導出手段は、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出するものであり、上記複数の部分領域のうち高周波数側の部分領域において設定される上記参照領域は、低周波数側の部分領域において設定される上記参照領域よりも小さい、ことを特徴としている。
上記のように構成された算術復号装置によれば、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出し、上記複数の部分領域のうち高周波数側の部分領域において設定される上記参照領域は、低周波数側の部分領域において設定される上記参照領域よりも小さいので、低周波数側の部分領域において設定される参照領域と高周波数側の部分領域において設定される参照領域とが同じ大きさを有する従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができると共に、高い符号化効率を実現することができる。
C33.
また、上記コンテキストインデックス導出手段は、上記部分領域毎に定まる所定の開始点と、上記部分領域毎に定まる変数とを加算することによってコンテキストインデックスを導出するものであり、上記変数の導出方法の異なる複数の部分領域について、開始点を同じ値に設定することにより、コンデキストインデックスの導出方法の異なる当該複数の部分領域において、共通のコンテキストを用いるものであることが好ましい。
上記のように構成された算術復号装置によれば、導出方法が異なる複数の部分領域において、部分領域毎に定まる開始点を等しくすることにより、コンテキスト数を増加させることがなく、また、高い符号化効率を実現したまま処理量の削減が可能である。
C34.
また、上記分割手段は、上記対象周波数領域を、処理対象の変換係数有無フラグの位置に応じて、少なくとも3つの部分領域に分類するものであり、上記コンテキストインデックス導出手段は、第1の部分領域では、復号済みの非0変換係数をN1個(N1は自然数)参照し、第2の部分領域では、復号済みの非0変換係数をN2個(N2はN2<N1を満たす自然数)参照することによって、コンテキストインデックスを導出し、第3の部分領域では、変換係数有無フラグの位置に応じて、コンテキストインデックスを導出することが好ましい。
上記のように構成された算術復号装置によれば、コンテキストインデックスを参照するために参照する復号済みの非0変換係数の数がより小さく設定された部分領域と、対象周波数領域における該変換係数有無フラグの位置に基づいてコンテキストインデックスを導出する部分領域とを組み合わせることによって、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C35.
また、上記算術復号装置において、上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数に更に基づいて導出する、ことが好ましい。
上記の構成によれば、上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数と、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数とに基づいて導出するものであり、上記複数の部分領域のうち高周波数側の部分領域において設定される上記参照領域は、低周波数側の部分領域において設定される上記参照領域よりも小さいので、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量をより効果的に削減できると共に、高い符号化効率を実現することができる。
C36.
また、本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを各スキャン列に沿って順次導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数に基づいて導出する、ことを特徴としている。
上記のように構成された算術復号装置によれば、上記複数の部分領域のうち高周波数側の部分領域における現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを、前スキャン列に沿った非0変換係数の数に基づいて導出する。ここで、前スキャン列に沿った非0変換係数の数は、一度カウントしておけば、現スキャン列に沿った各変換係数有無フラグに割り付けるコンテキストインデックスを導出する際に共通に用いることができる。したがって、位置の異なる変換係数有無フラグに対して個別にコンテキストインデックスを導出する必要のある従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができると共に、高い符号化効率を実現することができる。
C37.
また、本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、上記コンテキストインデックス導出手段は、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出するものであり、上記参照領域に含まれる復号済みの変換係数の数は、4以下である、ことを特徴としている。
上記のように構成された算術復号装置によれば、各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置周辺に設定された参照領域に含まれる復号済みの非0変換係数の数に基づいて導出するものであり、上記参照領域に含まれる復号済みの変換係数の数は、4以下であるので、従来の構成よりも少ない数の復号済みの変換係数を参照すれば足りる。したがって、上記の構成によれば、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができると共に、高い符号化効率を実現できる。
C38.
また、本発明の一態様に係る算術復号装置は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られた符号化データを復号する算術復号装置であって、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、各部分領域に対して、互いに異なるコンテキストインデックスを割り付けるコンテキストインデックス割り付け手段と、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグを、該変換係数有無フラグが属する部分領域に割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術復号するシンタックス復号手段と、を備え、上記複数の部分領域のうち低周波数側の部分領域は、高周波数側の部分領域よりも小さいことを特徴としている。
上記のように構成された算術復号装置によれば、上記複数の部分領域のうち低周波数側の部分領域は、高周波数側の部分領域よりも小さいので、低周波数側の領域に対して、コンテキストインデックスをきめ細かく割り当てることができる。したがって、上記の構成によれば、低周波数側のシンタックスを効率的に復号することができるので、符号化効率が向上する。
C39.
また、上記分割手段は、変換係数有無フラグのX座標とY座標のと和を示すSUMに応じて、上記対象周波数領域を、複数の部分領域に分割するものであり、上記分割手段は、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第1の閾値TH2との大小関係に応じて、上記対象周波数領域を、少なくとも低周波数側の部分領域と上記高周波数側の部分領域に分割し、第1の閾値TH2がsz以上であることが好ましい。
上記のように構成された算術復号装置によれば、対象周波数領域における変換係数有無フラグに割り付けるコンテキストインデックスを、該変換係数有無フラグの当該対象周波数領域における位置に基づいて導出する場合においても、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C40.
また、上記分割手段は、変換係数有無フラグのX座標とY座標のと和を示すSUMに応じて、上記対象周波数領域を、複数の部分領域に分割するものであり、上記分割手段は、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第1の閾値TH2との大小関係に応じて、上記対象周波数領域を、少なくとも上記低周波数側の部分領域と上記高周波数側の部分領域に分割し、第1の閾値TH2がsz−2以下であることが好ましい。
上記のように構成された算術復号装置によれば、コンテキストインデックスを参照するために参照する復号済みの非0変換係数の数がより小さく設定された部分領域を用いる場合においても、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C41.
また、上記分割手段は、変換係数有無フラグのX座標とY座標のと和を示すSUMに応じて、上記対象周波数領域を、複数の部分領域に分割するものであり、上記分割手段は、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第1の閾値TH2との大小関係に応じて、上記対象周波数領域を、上記第1の部分領域と上記第2の部分領域に分割し、上記SUMと、上記対象周波数領域のサイズszに応じて定まる第2の閾値TH3との大小関係に応じて、上記対象周波数領域を、上記第2の部分領域と上記第3の部分領域に分割し、上記第1の閾値TH2がsz−2以下であり、上記第2の閾値TH3がsz以上であることが好ましい。
上記のように構成された算術復号装置によれば、コンテキストインデックスを参照するために参照する復号済みの非0変換係数の数がより小さく設定された部分領域と、対象周波数領域における該変換係数有無フラグの位置に基づいてコンテキストインデックスを導出する部分領域とを組み合わせる場合においても、高い符号化効率を実現しつつ、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量を削減することができる。
C42.
また、本発明の一態様に係る画像復号装置は、上記算術復号装置と、上記算術復号装置によって復号された変換係数を逆周波数変換することによって残差画像を生成する逆周波数変換手段と、上記逆周波数変換手段によって生成された残差画像と、生成済みの復号画像から予測された予測画像とを加算することによって復号画像を生成する復号画像生成手段と、を備えていることを特徴としている。
上記画像復号装置によれば、シンタックス導出のための処理量を削減しつつ、高い符号化効率にて符号化データを復号することができる。
C43.
また、本発明の一態様に係る算術符号化装置は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって符号化データを生成する算術符号化装置であって、処理対象の単位領域に対応する対象周波数領域を複数の部分領域に分割する分割手段と、各部分領域に属する各変換係数が0であるか否かを示すシンタックスである各変換係数有無フラグに割り付けるコンテキストインデックスを導出するコンテキストインデックス導出手段と、各部分領域に属する各変換係数有無フラグを、該変換係数有無フラグに割り付けられたコンテキストインデックスによって指定される確率状態に基づいて算術符号化するシンタックス符号化手段と、を備え、上記コンテキストインデックス導出手段は、上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出する、ことを特徴としている。
上記のように構成された算出符号化装置によれば、上記複数の部分領域のうち高周波数側の部分領域に属する各変換係数有無フラグに割り付けるコンテキストインデックスを、対象周波数領域における該変換係数有無フラグの位置に基づいて導出するので、従来の構成に比べて、高周波数側でのコンテキストインデックスの導出処理のための処理量が削減される。
C44.
また、本発明の一態様に係る画像符号化装置は、符号化対象画像と予測画像との残差画像を単位領域毎に周波数変換することによって変換係数を生成する変換係数生成手段と、上記算術符号化装置と、を備えており、上記算術符号化装置は、上記変換係数生成手段によって生成された変換係数を表す各種のシンタックスを算術符号化することによって符号化データを生成するものである、ことを特徴としている。
上記画像復号装置によれば、シンタックス導出のための処理量を削減しつつ、高い符号化効率にて符号化データを生成することができる。
C45.
また、本発明の一態様に係る符号化データのデータ構造は、対象画像を単位領域毎に周波数変換して得られる各変換係数について、該変換係数を表す各種シンタックスを算術符号化することによって得られる符号化データのデータ構造であって、各単位領域に対応する各対象周波数領域における高周波数側の変換係数を復号するか否かを示す制限フラグを含み、上記符号化データを復号する算術復号装置は、上記制限フラグが、高周波数側の変換係数を復号しないことを示している場合には、当該高周波数側の変換係数を復号しない、ことを特徴としている。
上記のように構成された符号化データによれば、各単位領域に対応する各対象周波数領域における高周波数側の変換係数を復号するか否かを示す制限フラグを含んでおり、上記符号化データを復号する算術復号装置は、上記制限フラグが、高周波数側の変換係数を復号しないことを示している場合には、当該高周波数側の変換係数の復号処理を省略することができるので、変換係数を復号するための処理量が削減される。
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
本発明は、算術符号化された符号化データを復号する算術復号装置、および、算術符号化された符号化データを生成する算術符号化装置に好適に用いることができる。
1 動画像復号装置(画像復号装置)
11 可変長符号復号部
111 量子化残差情報復号部(算術復号装置)
120 変換係数復号部
124 係数有無フラグ復号部
124a 周波数分類部(分割手段、コンテキストインデックス導出手段)
124b 低周波位置コンテキスト導出部(コンテキストインデックス導出手段)
124c,124g 周辺参照コンテキスト導出部(コンテキストインデックス導出手段)
124d 高周波位置コンテキスト導出部(コンテキストインデックス導出手段)
X1 サブブロック係数有無フラグ復号部(サブブロック係数有無フラグ復号手段)
130 算術符号復号部
131 コンテキスト記録更新部
132 ビット復号部(シンタックス復号手段)
2 動画像符号化装置(画像符号化装置)
27 可変長符号符号化部
271 量子化残差情報符号化部(算術符号化装置)
220 変換係数符号化部
224 係数有無フラグ符号化部
224a 周波数分類部(分割手段、シンタックス符号化手段)
224b 低周波位置コンテキスト導出部
224c 周辺参照コンテキスト導出部
224d 高周波位置コンテキスト導出部(コンテキストインデックス導出手段)
X2 サブブロック係数有無フラグ符号化部(サブブロック係数有無フラグ符号化手段)
230 算術符号符号化部
231 コンテキスト記録更新部
232 ビット符号化部(シンタックス符号化手段)

Claims (8)

  1. コンテキストに応じてフラグを復号する算術復号装置であって、
    変換単位内のサブブロック位置によって指定されるサブブロックに、非ゼロ変換係数が含まれているか否かを示すサブブロック係数有無フラグに割り付ける第1のコンテキストインデックスと、該サブブロック内の変換係数が非0変換係数であるか否かを示す変換係数有無フラグに割り付ける第2のコンテキストインデックスと、を導出するコンテキストインデックス導出手段と、
    上記第1のコンテキストインデックスによって指定される第1の確率状態に基づいて、上記サブブロック係数有無フラグを復号し、上記第2のコンテキストインデックスによって指定される第2の確率状態に基づいて、上記変換係数有無フラグを復号する変換係数有無フラグ復号手段と、を備え、
    上記変換係数有無フラグは、上記サブブロック係数有無フラグの値が1の場合に復号され、
    上記コンテキストインデックス導出手段は、変換単位のサイズが16×16の合には、上記サブブロック位置を、該変換単位を4×4個に分割した4×4サブブロックの位置に設定し、該変換単位のサイズが32×32の場合には、上記サブブロック位置を、該変換単位を8×8個に分割した4×4サブブロックの位置に設定し、該4×4サブブロックの位置に応じて異なる方法により、上記第2のコンテキストインデックスを導出することを特徴とする算術復号装置。
  2. 上記第2のコンテキストインデックスは、上記変換単位のサイズに関わらず、上記4×4サブブロックの位置のX座標とY座標の和が1未満か、1以上かに応じて導出されることを特徴とする請求項1に記載の算術復号装置。
  3. 上記4×4サブブロックの位置に基づいて、上記第2のコンテキストインデックスのオフセットを変更することを特徴とする請求項1または請求項2に記載の算術復号装置。
  4. コンテキストに応じてフラグを符号化する算術符号化装置であって、
    変換単位内のサブブロック位置によって指定されるサブブロックに、非ゼロ変換係数が
    含まれているか否かを示すサブブロック係数有無フラグに割り付ける第1のコンテキストインデックスと、該サブブロック内の変換係数が非0変換係数であるか否かを示す変換係数有無フラグに割り付ける第2のコンテキストインデックスと、を導出するコンテキストインデックス導出手段と、
    上記第1のコンテキストインデックスによって指定される第1の確率状態に基づいて、上記サブブロック係数有無フラグを符号化し、上記第2のコンテキストインデックスによって指定される第2の確率状態に基づいて、上記変換係数有無フラグを符号化する変換係数有無フラグ符号化手段と、を備え、
    上記変換係数有無フラグは、上記サブブロック係数有無フラグの値が1の場合に符号化され、
    上記コンテキストインデックス導出手段は、変換単位のサイズが16×16の合には、上記サブブロック位置を、該変換単位を4×4個に分割した4×4サブブロックの位置に設定し、該変換単位のサイズが32×32の場合には、上記サブブロック位置を、該変換単位を8×8個に分割した4×4サブブロックの位置に設定し、該4×4サブブロックの位置に応じて異なる方法により、上記第2のコンテキストインデックスを導出することを特徴とする算術符号化装置。
  5. 上記第2のコンテキストインデックスは、上記変換単位のサイズに関わらず、上記4×4サブブロックの位置のX座標とY座標の和が1未満か、1以上かに応じて導出されることを特徴とする請求項4に記載の算術符号化装置。
  6. 上記4×4サブブロックの位置に基づいて、上記第2のコンテキストインデックスのオフセットを変更することを特徴とする請求項4または請求項5に記載の算術符号化装置。
  7. コンテキストに応じてフラグを復号する算術復号方法であって、
    変換単位内のサブブロック位置によって指定されるサブブロックに、非ゼロ変換係数が含まれているか否かを示すサブブロック係数有無フラグに割り付ける第1のコンテキストインデックスと、該サブブロック内の変換係数が非0変換係数であるか否かを示す変換係数有無フラグに割り付ける第2のコンテキストインデックスと、を導出するコンテキストインデックス導出ステップと、
    上記第1のコンテキストインデックスによって指定される第1の確率状態に基づいて、上記サブブロック係数有無フラグを復号し、上記第2のコンテキストインデックスによって指定される第2の確率状態に基づいて、上記変換係数有無フラグを復号する変換係数有無フラグ復号ステップと、を含み、
    上記変換係数有無フラグは、上記サブブロック係数有無フラグの値が1の場合に復号され、
    上記コンテキストインデックス導出ステップは、変換単位のサイズが16×16の合には、上記サブブロック位置を、該変換単位を4×4個に分割した4×4サブブロックの位置に設定し、該変換単位のサイズが32×32の場合には、上記サブブロック位置を、該変換単位を8×8個に分割した4×4サブブロックの位置に設定し、該4×4サブブロックの位置に応じて異なる方法により、上記第2のコンテキストインデックスを導出することを特徴とする算術復号方法。
  8. コンテキストに応じてフラグを符号化する算術符号化方法であって、
    変換単位内のサブブロック位置によって指定されるサブブロックに、非ゼロ変換係数が含まれているか否かを示すサブブロック係数有無フラグに割り付ける第1のコンテキストインデックスと、該サブブロック内の変換係数が非0変換係数であるか否かを示す変換係数有無フラグに割り付ける第2のコンテキストインデックスと、を導出するコンテキストインデックス導出ステップと、
    上記第1のコンテキストインデックスによって指定される第1の確率状態に基づいて、
    上記サブブロック係数有無フラグを符号化し、上記第2のコンテキストインデックスによって指定される第2の確率状態に基づいて、上記変換係数有無フラグを符号化する変換係数有無フラグ符号化手段と、を含み、
    上記変換係数有無フラグは、上記サブブロック係数有無フラグの値が1の場合に符号化され、
    上記コンテキストインデックス導出ステップは、変換単位のサイズが16×16の合には、上記サブブロック位置を、該変換単位を4×4個に分割した4×4サブブロックの位置に設定し、該変換単位のサイズが32×32の場合には、上記サブブロック位置を、該変換単位を8×8個に分割した4×4サブブロックの位置に設定し、該4×4サブブロックの位置に応じて異なる方法により、上記第2のコンテキストインデックスを導出することを特徴とする算術符号化方法。
JP2017040790A 2011-11-04 2017-03-03 算術復号装置、算術符号化装置、算術復号方法、および、算術符号化方法 Active JP6560702B2 (ja)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
JP2011242840 2011-11-04
JP2011242840 2011-11-04
JP2011264156 2011-12-01
JP2011264156 2011-12-01
JP2012009447 2012-01-19
JP2012009447 2012-01-19

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2013541794A Division JPWO2013065702A1 (ja) 2011-11-04 2012-10-31 算術復号装置、画像復号装置、算術符号化装置、画像符号化装置、および、算術復号方法

Publications (2)

Publication Number Publication Date
JP2017123685A JP2017123685A (ja) 2017-07-13
JP6560702B2 true JP6560702B2 (ja) 2019-08-14

Family

ID=48192047

Family Applications (2)

Application Number Title Priority Date Filing Date
JP2013541794A Pending JPWO2013065702A1 (ja) 2011-11-04 2012-10-31 算術復号装置、画像復号装置、算術符号化装置、画像符号化装置、および、算術復号方法
JP2017040790A Active JP6560702B2 (ja) 2011-11-04 2017-03-03 算術復号装置、算術符号化装置、算術復号方法、および、算術符号化方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
JP2013541794A Pending JPWO2013065702A1 (ja) 2011-11-04 2012-10-31 算術復号装置、画像復号装置、算術符号化装置、画像符号化装置、および、算術復号方法

Country Status (8)

Country Link
US (6) US9525876B2 (ja)
EP (1) EP2775713B1 (ja)
JP (2) JPWO2013065702A1 (ja)
CN (3) CN109120930B (ja)
IN (1) IN2014CN03598A (ja)
MX (2) MX338671B (ja)
MY (1) MY167316A (ja)
WO (1) WO2013065702A1 (ja)

Families Citing this family (42)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10091529B2 (en) * 2010-07-09 2018-10-02 Samsung Electronics Co., Ltd. Method and apparatus for entropy encoding/decoding a transform coefficient
MX2013008534A (es) * 2011-12-21 2013-08-12 Panasonic Corp Metodo de codificacion de imagen, metodo de decodificacion de imagen, aparato codificador de imagen y aparato decodificador de imagen.
US9743116B2 (en) 2012-01-19 2017-08-22 Huawei Technologies Co., Ltd. High throughput coding for CABAC in HEVC
US20130188736A1 (en) 2012-01-19 2013-07-25 Sharp Laboratories Of America, Inc. High throughput significance map processing for cabac in hevc
US10616581B2 (en) 2012-01-19 2020-04-07 Huawei Technologies Co., Ltd. Modified coding for a transform skipped block for CABAC in HEVC
US9860527B2 (en) * 2012-01-19 2018-01-02 Huawei Technologies Co., Ltd. High throughput residual coding for a transform skipped block for CABAC in HEVC
CN111683255B (zh) * 2012-01-20 2022-08-02 索尼公司 有效度图编码的复杂度降低
MY200990A (en) * 2012-07-02 2024-01-29 Samsung Electronics Co Ltd Entrophy Coding of a Video and Entropy Decoding of a Video
US9619229B2 (en) 2012-12-27 2017-04-11 Intel Corporation Collapsing of multiple nested loops, methods and instructions
JP6569665B2 (ja) * 2014-03-25 2019-09-04 株式会社ソシオネクスト 画像復号装置、画像復号方法、及び集積回路
EP2958328A1 (en) * 2014-06-20 2015-12-23 Thomson Licensing Method and device for signaling in a bitstream a picture/video format of an LDR picture and a picture/video format of a decoded HDR picture obtained from said LDR picture and an illumination picture
US9781424B2 (en) * 2015-01-19 2017-10-03 Google Inc. Efficient context handling in arithmetic coding
EP3751304A1 (en) 2015-05-12 2020-12-16 HERE Global B.V. Compressing and decompressing data about radio signals
EP3099072A1 (en) * 2015-05-28 2016-11-30 Parabola Research Limited Method, system and device for image and video coding
WO2017041271A1 (en) * 2015-09-10 2017-03-16 Mediatek Singapore Pte. Ltd. Efficient context modeling for coding a block of data
US10531102B2 (en) * 2015-09-10 2020-01-07 Samsung Electronics Co., Ltd. Encoding device, decoding device, and encoding and decoding method thereof
EP3349445A4 (en) * 2015-09-11 2019-03-20 KT Corporation METHOD AND DEVICE FOR PROCESSING VIDEO SIGNAL
US10440399B2 (en) * 2015-11-13 2019-10-08 Qualcomm Incorporated Coding sign information of video data
US20170311003A1 (en) * 2016-04-20 2017-10-26 Mediatek Inc. Method and apparatus for performing entropy encoding with sign data removal and associated method and apparatus for performing entropy decoding with sign data recovery
CN113411579B (zh) 2016-05-13 2024-01-23 夏普株式会社 图像解码装置及其方法、图像编码装置及其方法
US10694202B2 (en) * 2016-12-01 2020-06-23 Qualcomm Incorporated Indication of bilateral filter usage in video coding
KR20180089290A (ko) * 2017-01-31 2018-08-08 세종대학교산학협력단 영상의 부호화/복호화 방법 및 장치
US10484695B2 (en) * 2017-10-23 2019-11-19 Google Llc Refined entropy coding for level maps
US11252420B2 (en) * 2017-12-15 2022-02-15 Lg Electronics Inc. Image coding method on basis of secondary transform and device therefor
FI3514968T3 (fi) 2018-01-18 2023-05-25 Blackberry Ltd Menetelmiä ja laitteita pistepilvien entropiakoodausta varten
EP3553745B1 (en) 2018-04-09 2021-09-01 BlackBerry Limited Methods and devices for binary entropy coding of point clouds
EP3562156A1 (en) * 2018-04-27 2019-10-30 InterDigital VC Holdings, Inc. Method and apparatus for adaptive context modeling in video encoding and decoding
US10645381B2 (en) 2018-04-30 2020-05-05 Google Llc Intra-prediction for smooth blocks in image/video
KR102533654B1 (ko) * 2018-07-02 2023-05-18 프라운호퍼 게젤샤프트 쭈르 푀르데룽 데어 안겐반텐 포르슝 에. 베. 종속 스칼라 양자화에 적합한 변환 계수의 엔트로피 코딩
AU2019298063B2 (en) * 2018-07-02 2022-10-13 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding
BR112021005558A2 (pt) * 2018-09-24 2021-06-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. aparelho para codificar e decodificar um bloco de coeficientes de transformação, codificador para codificar e decodificador para decodificar um bloco de coeficiente de transformação, método para codificar e decodificar um bloco de coeficientes de transformação, corrente de dados
WO2020073884A1 (en) * 2018-10-08 2020-04-16 Mediatek Singapore Pte. Ltd. Method and apparatus of last significant coefficient coding in image and video coding
US10728557B2 (en) * 2018-10-24 2020-07-28 Sony Corporation Embedded codec circuitry for sub-block based entropy coding of quantized-transformed residual levels
EP3884669A1 (en) * 2018-11-21 2021-09-29 InterDigital VC Holdings, Inc. Residual coding with reduced usage of local neighborhood
JP2021510943A (ja) * 2018-12-17 2021-04-30 エルジー エレクトロニクス インコーポレイティド 高周波ゼロイングに基づいて変換係数スキャン順序を決定する方法及び装置
WO2020171592A1 (ko) * 2019-02-19 2020-08-27 엘지전자 주식회사 영상 코딩 시스템에서 레지듀얼 정보를 사용하는 영상 디코딩 방법 및 그 장치
US10939107B2 (en) 2019-03-01 2021-03-02 Sony Corporation Embedded codec circuitry for sub-block based allocation of refinement bits
EP3939296A1 (en) * 2019-03-12 2022-01-19 FRAUNHOFER-GESELLSCHAFT zur Förderung der angewandten Forschung e.V. Selective inter-component transform (ict) for image and video coding
JP7484923B2 (ja) * 2019-09-06 2024-05-16 ソニーグループ株式会社 画像処理装置および方法
CN115299064A (zh) 2020-03-11 2022-11-04 抖音视界有限公司 基于颜色格式的自适应参数集信令通知
WO2021244420A1 (en) 2020-05-31 2021-12-09 Beijing Bytedance Network Technology Co., Ltd. Palette mode with local dual tree modetype definition
JP2024058010A (ja) * 2022-10-13 2024-04-25 Kddi株式会社 メッシュ復号装置、メッシュ符号化装置、メッシュ復号方法及びプログラム

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7336711B2 (en) * 2001-11-16 2008-02-26 Ntt Docomo, Inc. Image encoding method, image decoding method, image encoder, image decode, program, computer data signal, and image transmission system
JP2003319391A (ja) * 2002-04-26 2003-11-07 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
EP2290989B1 (en) * 2002-05-28 2015-01-28 Sharp Kabushiki Kaisha Method and systems for image intra-prediction mode estimation, communication, and organization
JP2005130099A (ja) * 2003-10-22 2005-05-19 Matsushita Electric Ind Co Ltd 算術復号装置、算術符号化装置、算術符号化・復号装置、携帯端末装置、動画像撮影装置、及び、動画像記録・再生装置
US7379608B2 (en) * 2003-12-04 2008-05-27 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. Arithmetic coding for transforming video and picture data units
JP2006140758A (ja) * 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
WO2007081116A1 (en) * 2006-01-07 2007-07-19 Electronics And Telecommunications Research Institute Method and apparatus for video data encoding and decoding
JP4424522B2 (ja) * 2006-07-13 2010-03-03 日本電気株式会社 符号化及び復号化装置ならびに符号化方法及び復号方法
TWI341657B (en) * 2007-04-03 2011-05-01 Nat Univ Tsing Hua Cabac decoding method
HUE037656T2 (hu) * 2010-04-13 2018-09-28 Fraunhofer Ges Forschung Valószínûség intervallum partícionáló kódoló és dekódoló
HUE040296T2 (hu) * 2010-04-13 2019-02-28 Ge Video Compression Llc Szignifikancia térképek és transzformációs együttható blokkok kódolása
US8976861B2 (en) * 2010-12-03 2015-03-10 Qualcomm Incorporated Separately coding the position of a last significant coefficient of a video block in video coding
EP3349360B1 (en) * 2011-01-14 2019-09-04 GE Video Compression, LLC Entropy encoding and decoding scheme
CN107517384B (zh) * 2011-06-16 2020-06-30 Ge视频压缩有限责任公司 解码器、编码器、解码方法、编码方法以及存储介质
US20130016789A1 (en) * 2011-07-15 2013-01-17 General Instrument Corporation Context modeling techniques for transform coefficient level coding
JP6130839B2 (ja) * 2011-10-06 2017-05-17 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン エントロピー符号化
US9191670B2 (en) * 2012-01-17 2015-11-17 Qualcomm Incorporated Throughput improvement for CABAC coefficient level coding

Also Published As

Publication number Publication date
US20190052905A1 (en) 2019-02-14
CN109120930B (zh) 2021-03-26
US9525876B2 (en) 2016-12-20
US20200154140A1 (en) 2020-05-14
US10897632B2 (en) 2021-01-19
MX338671B (es) 2016-04-27
US20180160144A1 (en) 2018-06-07
CN109120930A (zh) 2019-01-01
EP2775713B1 (en) 2021-06-16
JP2017123685A (ja) 2017-07-13
MY167316A (en) 2018-08-16
CN109120927B (zh) 2021-05-18
MX346677B (es) 2017-03-29
CN103907349B (zh) 2018-08-28
IN2014CN03598A (ja) 2015-07-31
US20170041635A1 (en) 2017-02-09
CN109120927A (zh) 2019-01-01
US10158887B2 (en) 2018-12-18
US20210084335A1 (en) 2021-03-18
US20140307801A1 (en) 2014-10-16
US11310530B2 (en) 2022-04-19
EP2775713A4 (en) 2015-05-06
EP2775713A1 (en) 2014-09-10
US10547870B2 (en) 2020-01-28
WO2013065702A1 (ja) 2013-05-10
MX2014005246A (es) 2014-08-22
CN103907349A (zh) 2014-07-02
JPWO2013065702A1 (ja) 2015-04-02

Similar Documents

Publication Publication Date Title
JP6560702B2 (ja) 算術復号装置、算術符号化装置、算術復号方法、および、算術符号化方法
US11627337B2 (en) Image decoding device
JP7001768B2 (ja) 算術復号装置
JP6957715B2 (ja) 画像フィルタ装置、フィルタ方法および動画像復号装置
JP6190361B2 (ja) 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
US10547861B2 (en) Image decoding device
JP6134651B2 (ja) 算術復号装置、算術符号化装置および算術復号方法
WO2016203881A1 (ja) 算術復号装置及び算術符号化装置
WO2013046990A1 (ja) オフセット復号装置、オフセット符号化装置、画像フィルタ装置、および、データ構造
JP2013192118A (ja) 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
JP2013187869A (ja) 算術復号装置、算術符号化装置、画像復号装置、および画像符号化装置
WO2012090962A1 (ja) 画像復号装置、画像符号化装置、および符号化データのデータ構造、ならびに、算術復号装置、算術符号化装置
JP2013223051A (ja) 算術復号装置、画像復号装置、算術符号化装置、および画像符号化装置
WO2012081706A1 (ja) 画像フィルタ装置、フィルタ装置、復号装置、符号化装置、および、データ構造
WO2019142764A1 (ja) 動画像符号化装置、動画像復号装置および動画像フィルタ装置
JP2022188825A (ja) 画像復号装置及び画像符号化装置
JP2021010050A (ja) 動画像符号化装置、動画像復号装置、およびフィルタ装置
JP2013251827A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造
JP2021057620A (ja) 画像フィルタ装置、画像復号装置、画像符号化装置、およびデータ構造

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180423

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181003

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20190305

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20190530

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20190607

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190625

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190719

R150 Certificate of patent or registration of utility model

Ref document number: 6560702

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150