JP5644987B1 - 映像符号化装置、映像符号化方法および映像符号化プログラム - Google Patents
映像符号化装置、映像符号化方法および映像符号化プログラム Download PDFInfo
- Publication number
- JP5644987B1 JP5644987B1 JP2014541455A JP2014541455A JP5644987B1 JP 5644987 B1 JP5644987 B1 JP 5644987B1 JP 2014541455 A JP2014541455 A JP 2014541455A JP 2014541455 A JP2014541455 A JP 2014541455A JP 5644987 B1 JP5644987 B1 JP 5644987B1
- Authority
- JP
- Japan
- Prior art keywords
- coefficient level
- coefficient
- significant
- orthogonal transform
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 51
- 238000013139 quantization Methods 0.000 claims abstract description 51
- 238000004364 calculation method Methods 0.000 claims description 49
- 230000008569 process Effects 0.000 claims description 41
- 230000005540 biological transmission Effects 0.000 claims description 36
- 230000009467 reduction Effects 0.000 claims description 34
- 238000001514 detection method Methods 0.000 claims description 32
- 230000009466 transformation Effects 0.000 claims description 17
- 230000001131 transforming effect Effects 0.000 claims description 4
- 238000012544 monitoring process Methods 0.000 claims description 2
- 230000003044 adaptive effect Effects 0.000 description 31
- 238000010586 diagram Methods 0.000 description 17
- 230000006835 compression Effects 0.000 description 6
- 238000007906 compression Methods 0.000 description 6
- 238000000638 solvent extraction Methods 0.000 description 6
- 239000000872 buffer Substances 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 4
- 230000033001 locomotion Effects 0.000 description 4
- 230000002265 prevention Effects 0.000 description 4
- 230000010365 information processing Effects 0.000 description 3
- 238000005192 partition Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000015556 catabolic process Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/169—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
- H04N19/18—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/136—Incoming video signal characteristics or properties
- H04N19/14—Coding unit complexity, e.g. amount of activity or edge presence estimation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/70—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/91—Entropy coding, e.g. variable length coding [VLC] or arithmetic coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
- H04N19/96—Tree coding, e.g. quad-tree coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
- H04N19/147—Data rate or code amount at the encoder output according to rate distortion criteria
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/64—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
- H04N19/647—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Abstract
直交変換係数を量子化して係数レベルを計算する量子化部は、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算し、画像ブロックにおいて伝送順で先頭からN 個前までに量子化手段が出力した係数レベルを監視して、少なくともその一つが有意であるか否かを示す状態変数を更新し、処理対象とする直交変換係数の位置と状態変数とに基づいて、処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算し、値情報ビット数と位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする。
Description
本発明は、伝送順で連続する直交変換係数を同時に量子化する技術に関する。
非特許文献1に記載された方法に基づいた映像符号化方式において、ディジタル化された映像の各フレームは符号化ツリーユニット(CTU :Coding Tree Unit)に分割され、ラスタスキャン順で各CTU が符号化される。CTU は、クアッドツリー構造で符号化ユニット(CU:Coding Unit )に分割されて符号化される。各CUは、予測ユニット(PU:Prediction Unit )に分割されて予測される。また、各CUの予測誤差は、クアッドツリー構造で、変換ユニット(TU:Transform Unit )に分割されて周波数変換される。
CUは、イントラ予測/フレーム間予測の符号化単位である。以下、イントラ予測およびフレーム間予測を説明する。
イントラ予測は、符号化対象フレームの再構築画像から生成する予測である。非特許文献1では、図9 に示す33種類の角度イントラ予測などが定義されている。角度イントラ予測では、符号化対象ブロック周辺の再構築画素を図9 に示す33種類の方向のいずれかに外挿して、イントラ予測信号が生成される。以下、イントラ予測を用いるCUをイントラCUと呼ぶ。
フレーム間予測は、符号化対象フレームと表示時刻が異なる再構築フレーム(参照ピクチャ)の画像に基づく予測である。以下、フレーム間予測をインター予測とも呼ぶ。図10は、フレーム間予測の例を示す説明図である。動きベクトルMV=(mvx, mvy)は、符号化対象ブロックに対する参照ピクチャの再構築画像ブロックの平行移動量を示す。インター予測は、参照ピクチャの再構築画像ブロックに基づいて(必要であれば画素補間を用いて)、インター予測信号を生成する。以下、インター予測を用いるCUをインターCUと呼ぶ。
なお、イントラCUのみで符号化されたフレームはIフレーム(またはIピクチャ)と呼ばれる。イントラCUだけでなくインターCUも含めて符号化されたフレームはPフレーム(またはPピクチャ)と呼ばれる。ブロックのインター予測に1枚の参照ピクチャだけでなく、さらに同時に2枚の参照ピクチャを用いるインターCUを含めて符号化されたフレームはBフレーム(またはBピクチャ)と呼ばれる。
次に、図11を参照して、ディジタル化された映像の各フレームの各CUを入力画像としてビットストリームを出力する一般的な映像符号化装置の構成と動作を説明する。
図11に示す映像符号化装置は、周波数変換器101 、量子化器1020、エントロピー符号化器103 、逆周波数変換/逆量子化器104 、バッファ105 、予測器106 、および推定器107 を備える。
図12は、フレームの空間解像度がCIF (Common Intermediate Format)、CTU サイズが64の場合の第t 番目のフレームのCTU 分割例、および、第8 番目のCTU (CTU8)のCU分割例を示す説明図である。また、図13は、CTU8のCU分割例に対応するクアッドツリー構造を示す説明図である。
図14は、CUのTU分割例を示す説明図である。上段には、イントラ予測 2N×2N PU のCUのTU分割例が示されている。CUがイントラ予測の場合、クアッドツリーの根(Root)をPUに配置し、予測誤差をクアッドツリー構造で表現する。下段には、インター予測 2N×N PUのCUのTU分割例が示されている。CUがインター予測の場合、クアッドツリーの根(Root)をCUに配置し、予測誤差をクアッドツリー構造で表現する。
推定器107 は、CTU 毎に、CUクアッドツリー構造、PU分割形状、およびTUクアッドツリー構造を決定する。
予測器106 は、推定器107 が決定したCUクアッドツリー構造およびPU分割形状に基づいて、CUの入力画像信号に対する予測信号を生成する。予測信号は、上述したイントラ予測またはインター予測に基づいて生成される。
周波数変換器101 は、推定器107 が決定したTUクアッドツリー構造に基づいて、入力画像信号から予測信号を減じた予測誤差画像を周波数変換する。
量子化器1020は、周波数変換された予測誤差画像(直交変換係数)を量子化する。以下、量子化された直交変換係数を係数レベルと呼ぶ。また、0以外の値を持つ係数レベルを有意係数レベルと呼ぶ。図15に示すように、量子化器1020は、直交変換係数Kij と量子化パラメータQPとを入力し、係数レベルLij を出力する係数レベル計算部1201を備える。
エントロピー符号化器103 は、CTU のクアッドツリー構造を示すcu_split_flag、予測パラメータ、および係数レベルをエントロピー符号化する。
逆周波数変換/逆量子化器104 は、係数レベルを逆量子化する。さらに、逆周波数変換/逆量子化器104 は、逆量子化した直交変換係数を逆周波数変換する。逆周波数変換された再構築予測誤差画像は、予測信号が加えられて、バッファ105 に供給される。バッファ105 は、再構築画像を格納する。
上述した動作に基づいて、一般的な映像符号化装置はビットストリームを生成する。
図16は、Kij を、4096の値を持つQsおよび1/3 の値を持つパラメータf で量子化した例を示す説明図である。以下、図16に示す 4×4 TUの例を用いて、量子化器1020とエントロピー符号化器103 の動作を詳しく説明する。
まず、 4×4 TUの直交変換係数Kij と係数レベルLij を以下のように定義する。
Kij (0 ≦ i, j ≦ 3)を、周波数軸での水平位置i および垂直位置j における直交変換係数の値と定義する。同様に、係数レベルLij を、直交変換係数Kij に対応する係数レベルの値と定義する。ただし、i 、j の値が大きいほど、Kij およびLij は高周波成分となる。
次に、量子化を詳しく説明する。係数レベル計算部1201は、Kij を量子化ステップQsで割ることによって、係数レベルLij を計算する。定式的には、係数レベルLij は、(1)式で表される。
Lij = Sign(Kij )・Floor (|Kij |/Qs+f ) (1)
ただし、Sign(a )は入力a の正負の符号を返す関数、Floor(a )は入力a 以下の最も大きな整数を返す関数、f は量子化特性を決定するパラメータ(0 ≦f ≦ 0.5)である。f の値を、インター予測においては1/6 、イントラ予測においては1/3 とする。
なお、Qsは、量子化パラメータQPを用いて以下の(2)式で示される。
ただし、N はTUのブロックサイズである。図16に示す 4×4 TUにおいては N=4 である。図16には、Kij を、4096の値を持つQsおよび1/3の値を持つf で量子化した例が示されている。
続いて、エントロピー符号化を詳しく説明する。まず、係数レベルに対するエントロピー符号化の説明において用いる位置情報と値情報を定義する。
本明細書において、位置情報は、TUに含まれるすべての有意係数レベルの位置を示す情報である。
非特許文献1の7.4.9.11を参照すると、HEVC(High Efficiency Video Coding)における位置情報は、最初に伝送する有意係数レベルの水平位置および垂直位置を示す情報last_significant_xおよびlast_significant_y と、(last_significant_x、last_significant_y )より後続の位置から(0, 0 )までのそれぞれの位置における有意係数レベルの有無を示す情報siginificant_coeff_flag とで構成される。ゆえに、位置情報ビット数は、最初に伝送する有意係数レベルの位置に基づいて決定されるlast_significant_xのビット数、last_significant_yのビット数、およびsiginificant_coeff_flag のビット数の総和である。
本明細書において、値情報は、有意係数レベルの値を示す情報である。
非特許文献1の7.4.9.11を参照すると、HEVCにおける値情報は、有意係数レベルの絶対値が1より大きいか否かを示す情報coeff_abs_level_greater1_flag 、有意係数レベルの絶対値が2より大きいか否かを示す情報coeff_abs_level_greater2_flag 、有意係数レベルの正負の符号を示す情報coeff_sign_flag 、およびcoeff_abs_level_greater1_flag やcoeff_abs_level_greater2_flag よりも大きな有意係数レベルの絶対値から、coeff_abs_level_greater1_flag とcoeff_abs_level_greater2_flag とを減じた値(有意係数レベルの残り)の絶対値を示す情報coeff_abs_level_remaining で構成される。ゆえに、値情報ビット数は、有意係数レベルのcoeff_abs_level_greater1_flag のビット数、coeff_abs_level_greater2_flag のビット数、coeff_sign_flag のビット数、およびcoeff_abs_level_remaining のビット数の総和である。
表1 には、位置情報および値情報と係数レベルLij との関係が示されている。表1 において、横軸に対する縦軸の項目は、図16に示された 4×4 TUにおける各Lij の情報を示す。
表1 におけるlast_significant_x、last_significant_yは、最初に伝送する有意係数レベルL30 = 1 の位置(i, j)=(3, 0)を示す。siginificant_coeff_flag は、(3, 0)より後続の位置から(0, 0)までのそれぞれの位置における有意係数レベルの有無を示す。有意係数レベルである場合はsiginificant_coeff_flag= 1、有意係数レベルでない場合にはsiginificant_coeff_flag =0とする。表1 では、L30=1 およびL01=1 は、それぞれcoeff_abs_level_greater1_flag=0 とcoeff_sign_flag=0 (正)とで表現される。なお、両方とも値が2未満であるため、coeff_abs_level_greater2_flag とcoeff_abs_level_remaining とは用いられない。
表2 には、位置情報および値情報と値情報のビット数との関係が示されている。表2 において、横軸に対する縦軸の項目は、図16に示された 4×4 TUの位置情報ビット数と値情報ビット数を示す。
表2 における各情報ビット数はbin 数で示される。bin は、エントロピー符号化器103 によって出力されるビットストリームに変換される前の中間ビット列における1つのビットを指す。
図16に示された 4×4 TUの場合、エントロピー符号化器103 は、TU内のすべての有意係数レベルの位置情報のビット13bin を伝送してから、それぞれの有意係数レベルの値情報のビット数、計4binを伝送する。位置情報は、last_significant_x、last_significant_yおよびsiginificant_coeff_flag で構成される。last_significant_xおよびlast_significant_yは、最初に伝送する有意係数の位置である(i, j)=(3, 0)を示し、4binである。siginificant_coeff_flag は、最初の伝送する有意係数の位置より後続の位置(2, 1)から、(0, 0)までの 9 位置それぞれのの有意係数レベルの有無を示し、9binである。
値情報はcoeff_abs_level_greater1_flag 、coeff_abs_level_greater2_flag 、coeff_sign_flag 、およびcoeff_abs_level_remaining で構成される。coeff_abs_level_greater1_flag は、L30 とL01 に対し、1より大きいか否かを示し2binである。coeff_abs_level_greater2_flag は、有意係数レベルの絶対値が2より大きい係数レベルが存在しないため、0binである。coeff_sign_flag は、L30 とL01 の正負の符号を示し、2binである。coeff_abs_level_remaining は、有意係数レベルの絶対値が2より大きい係数レベルが存在しないため、0binである。
なお、 4×4 TUの場合、それぞれの情報の最大bin 数は下記の通りである。すなわち、非特許文献1 の7.4.9.11に基づけば 4×4 TUにおいては最大値が3 (=N-1=4-1)であるから、last_significant_xは最大3binである。同様に、last_significant_yも、最大3binである。非特許文献1 の7.3.8.11に基づけば 4×4 TUあたり最大15であるから、siginificant_coeff_flag は最大15bin である。非特許文献1 の7.3.9.11に基づけば 4×4 TUあたり最大8 であるから、coeff_abs_level_greater1_flag は最大8binである。非特許文献1 の7.3.8.11に基づけば 4×4 TUあたり最大1 であるから、coeff_abs_level_greater2_flag は最大1binである。
非特許文献1 の7.3.8.11に基づけば 4×4 TUあたり最大16であるから、coeff_sign_flag は最大16bin である。非特許文献1 の9.3.3.9 に基づいて、coeff_abs_level_remaining に対するbin が算出される。
なお、非特許文献1 の9.2.2.8 の式(9-13 )および(9-14 )からわかるように、最後に伝送した有意係数レベルの値が所定の閾値を超える度に、coeff_abs_level_remaining のprefix部のbin string には高次元のTU符号が適用されるようになり、coeff_abs_level_remaining のsuffix部のbin stringには高次元のExp-Golom 符号が適用される。つまり、小さな値のcoeff_abs_level_remaining のsuffix部に対するbin 数は多くなり、大きな値のcoeff_abs_level_remainingのsuffix部に対するbin は少なくなる。
High efficiency video coding (HEVC) text specification draft 9, JCTVC-L1003_v34, Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11 12th Meeting: Geneva, CH, 14-23 Jan. 2013.
徳満健太 他、「低ビットレートHEVC符号化のためのエンロトピー制約量子化」(D-11-46 )、電子情報通信学会総合大会 情報・システム講演論文集2、2013年3月.
上述した一般的な映像符号化装置の量子化器は、高コスト係数レベルを発生する場合がある。高コスト係数レベルは、信号雑音比(Signal-Noise Ratio)を改善しないにも関わらずエントロピー符号化後に多くのビット数を発生する有意係数レベルである。値が小さく、かつ、位置情報のビット数が多い有意係数レベルがその典型例となる。上述した一般的な映像符号化装置には、量子化器が出力する高コスト係数レベルの伝送によって圧縮効率が低下する問題がある。
非特許文献2に開示されているように、値情報のビット数と位置情報のビット数とを考慮して直交変換係数を量子化することによって、高コスト係数レベルの発生を防止できる。しかし、非特許文献2に記載された位置情報ビット数の計算は、直前までに量子化器が有意係数レベルを出力したか否かの情報を用いる。従って、位置情報のビット数を用いて高コスト係数レベルの発生を防止する場合、伝送順で連続する複数の係数レベルを同時に決定できない。つまり、並列量子化処理ができない。並列量子化処理ができない映像符号化装置には、クロック周波数の引き上げによる処理性能維持が必要になり、消費電力が増大する問題がある。
すなわち、圧縮効率低下防止と並列量子化処理を両立できない。
本発明は、値情報と位置情報のビット数を考慮して伝送順で連続する複数の係数レベルを同時に決定することにより、圧縮効率低下防止と複数直交変換係数の並列量子化処理を両立した映像符号化装置、映像符号化方法および映像符号化プログラムを提供することを目的とする。
本発明による映像符号化装置は、画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、直交変換係数を量子化して係数レベルを計算する量子化手段と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備え、量子化手段は、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、画像ブロックにおいて伝送順で先頭からN 個前までに量子化手段が出力した係数レベルを監視して、少なくともその一つが有意であるか否かを示す状態変数を更新する状態変数更新手段と、処理対象とする直交変換係数の位置と状態変数とに基づいて、処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する位置情報ビット数計算手段と、値情報ビット数と位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする高コスト係数レベル検出/除去手段とを含むことを特徴とする。
本発明による映像符号化方法は、画像ブロックを直交変換して直交変換係数を計算し、直交変換係数を量子化して係数レベルを計算し、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する映像符号化方法であって、係数レベルを計算する際に、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算し、画像ブロックにおいて伝送順で先頭からN 個前までの係数レベルのうちの少なくとも一つが有意であるか否かを示す状態変数を更新し、処理対象とする直交変換係数の位置と状態変数とに基づいて、処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算し、値情報ビット数と位置情報ビット数とが所定の条件を満たす有意係数レベルを0にすることを特徴とする。
本発明による映像符号化プログラムは、コンピュータに、画像ブロックを直交変換して直交変換係数を計算する処理と、直交変換係数を量子化して係数レベルを計算する処理と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する処理とを実行させ、係数レベルを計算する処理で、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する処理と、画像ブロックにおいて伝送順で先頭からN 個前までの係数レベルのうちの少なくとも一つが有意であるか否かを示す状態変数を更新する処理と、処理対象とする直交変換係数の位置と状態変数とに基づいて、処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する処理と、値情報ビット数と位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする処理とを実行させることを特徴とする。
本発明によれば、圧縮効率低下防止と複数直交変換係数の並列量子化処理を両立した映像符号化装置を実現できる。
下記の実施形態では、映像符号化装置は、直前までに量子化器が有意係数レベルを出力したか否かの情報ではなく、伝送順で先頭から処理対象のN(N ≧2)個前までに量子化器が有意係数レベルを出力したか否かの情報を用いて位置情報ビット数を計算する。映像符号化装置は、直前のN-1 個の係数レベルを用いることなく位置情報ビット数を計算できるようになり、並列処理が可能となる。
ただし、処理対象の変更により、位置情報ビット数を誤って多く見積もって、高コスト係数レベルではない係数レベルを除去することが懸念される。そこで、伝送ビット数ΔR を誤って多く見積もる確率は、TUの先頭から処理対象M のN(N ≧2)個前までに量子化器が全て0を出力した確率と、処理対象の直前のN-1個の係数レベルのいずれか一つが有意係数レベルとなる確率の積であることに着目する。前者の確率は、1未満の値の直積となるため、伝送順で末尾になるほど、つまり、係数レベルの周波数成分が低周波になるほど、小さな値となる。また、係数レベルの値が0に偏る傾向から、後者の確率も小さな値となる。位置情報ビット数を誤って多く見積もる確率は低くなるため、高コスト係数レベルではない係数レベルを除去する確率も低くなる。
映像符号化装置は、伝送順で画像ブロックの先頭からN 個前までに量子化器が出力した係数レベルを用いて各有意係数レベルの位置情報ビット数を計算するとともに、連続するN 個の仮係数レベルに対して同時に位置情報と値情報のビット数を考慮して、量子化出力する係数レベルを決定できるので、圧縮効率低下防止と複数直交変換係数の並列量子化処理を両立できる。
実施形態1.
図1 は、本発明による映像符号化装置の第1の実施形態を示すブロック図である。図1 を参照して、ディジタル化された映像の各フレームを入力画像としてビットストリームを出力する第1 の実施形態の映像符号化装置の構成を説明する。
図1 は、本発明による映像符号化装置の第1の実施形態を示すブロック図である。図1 を参照して、ディジタル化された映像の各フレームを入力画像としてビットストリームを出力する第1 の実施形態の映像符号化装置の構成を説明する。
第1の実施形態の映像符号化装置は、位置情報ビット数が値情報ビット数よりも多い係数レベルを高コスト係数レベルとみなし、N 個の連続する直交変換係数を同時に量子化する。映像符号化装置は、値情報のビット数と位置情報のビット数とを考慮して伝送順で連続する複数の係数レベルを同時に決定することにより、圧縮効率低下防止と複数直交変換係数の並列量子化処理を両立する。
図1 に示す映像符号化装置は、周波数変換器101 、適応量子化器1021 、エントロピー符号化器103 、逆周波数変換/逆量子化器104 、バッファ105 、予測器106 、および推定器107 を備える。図11に示す映像符号化装置と比較すると、量子化器1020に代えて適応量子化器1021が設けられている。図1 に示す映像符号化装置における他のブロックは、図11に示す映像符号化装置におけるブロックと同じである。よって、以下、適応量子化器1021のみを説明する。
図2 は、適応量子化器1021の構成を示すブロック図である。図2 に示す適応量子化器は、図15に示す量子化器の係数レベル計算部1201に加えて、値情報ビット数計算部(Rvalue計算部)1202、位置情報ビット数計算部(Rposition 計算部)1203、高コスト係数レベル検出/除去部1204、および状態変数更新部(StateFlag 更新部)1205を有する。また、係数レベル計算部1201、値情報ビット数計算部(Rvalue計算部)1202、位置情報ビット数計算部(Rposition 計算部)1203、および高コスト係数レベル検出/除去部1204とを総称して、係数レベル決定部110 と呼ぶ。
係数レベル計算部1201は、上記の(1)式を用いて、直交変換係数Kij と量子化パラメータQPとを入力し、仮係数レベルL'ijを出力する。例えば、 4×4 TUの場合、各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 ((3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(1, 2)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)にL'ij (0 ≦ i, j ≦ 3)を出力する。
Rvalue計算部1202は、仮係数レベルL'ijを入力し、値情報ビット数であるRvalueを計算して出力する。Rvalueは、L'ijの値を示す情報のビット数である。具体的には、Rvalueは、有意係数レベルの絶対値が1より大きいか否かを示す情報coeff_abs_level_greater1_flag のビット数、有意係数レベルの絶対値が2より大きいか否かを示す情報coeff_abs_level_greater2_flag のビット数、有意係数レベルの正負の符号を示す情報coeff_sign_flag のビット数、および処理対象有意係数レベルの絶対値と処理対象有意係数レベルの直前より前の有意係数レベルの絶対値とに基づいて計算される。Rvalueは、有意係数レベルの絶対値からcoeff_abs_level_greater1_flag とcoeff_abs_level_greater2_flag を減じた値の絶対値を示す情報coeff_abs_level_remaining のビット数の和である。
StateFlag 更新部1205は、適応量子化器1021において出力される係数レベルLij を監視し、StateFlag を更新して出力する。StateFlag 更新部1205は、TUの量子化処理を開始する度にStateFlag を0に初期化する。StateFlag=0 は、処理対象TUにおいて適応量子化器1021が有意な係数レベルLij を未出力であることを示す。StateFlag 更新部1205は、処理対象TUにおいて伝送順で先頭からN (≧2 )個前までに適応量子化器1021が有意な係数レベルLij を出力したとき、StateFlag を1に更新する 。StateFlag=1 は、処理対象TUにおいて伝送順で先頭からN 個前までに適応量子化器1021が有意な係数レベルLij を出力したこと示す。例えば、N が4 で、かつ、直交変換係数K13 を処理対象とする場合、先頭から4 個前までに適応量子化器1021が出力した係数レベルL33 とL32 を使ってK13 のStateFlag を更新する。つまり、StateFlag を更新する際に、直前の3つの係数レベルL23 、L31 、およびL22 を使用しない。
Rposition 計算部1203は、直交変換係数位置(i, j)とStateFlag とを入力し、位置情報ビット数であるRposition を計算して出力する。Rposition は、TUのすべての有意係数レベルの周波数軸上での位置を示す情報のビット数である。Rposition 計算部1203は、StateFlag が0の場合、処理対象の直交変換係数の有意係数レベルが最初に伝送される有意係数レベルであると判断し、この有意係数レベルの水平位置および垂直位置をそれぞれ示す情報last_significant_xおよびlast_significant_yのビット数と、(last_significant_x、last_significant_y)より後続の位置から (0, 0)までの位置における有意係数レベルの有無を示す情報siginificant_coeff_flagのビット数の和をRposition として計算する。StateFlag が1の場合、TUのすべての有意係数レベルの周波数軸上での位置を示す情報を伝送済みとして判断し、Rposition を0として計算する。
高コスト係数レベル検出/除去部1204は、L'ij、Rvalue、およびRposition を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、Rposition がRvalueより大きい場合、L'ijを高コスト係数レベルとして検出し、Lij として0の値を出力する。すなわち、高コスト係数レベル検出/除去部1204は、高コスト係数レベルの発生を防止する。そうでない場合には、高コスト係数レベル検出/除去部1204は、仮係数レベルL'ijをLij として出力する。
係数レベル決定部110 は、Kij 、QP、および直交変換係数位置 (i, j)を入力とし、Lij を出力する。
次に、図3 のフローチャートを参照して、適応量子化器1021の動作を説明する。適応量子化器1021は、TU毎に、TU内の各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 (例えば、4x4TUの場合には、(3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(12)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)に以下のように動作する。
ステップS101で、係数レベル計算部1201は、上記の(1)式を用いて、直交変換係数Kij と量子化パラメータQPとを入力し、仮係数レベルL'ijを出力する。
ステップS102で、係数レベル計算部1201は、L'ijの値が0でないかを判断する。L'ijの値が0でない場合には、ステップS103に移行する。L'ijの値が0である場合には、係数レベル計算部1201は、Lij =L'ijとする(ステップS110)。そして、ステップS107に移行する。
ステップS103で、Rvalue 計算部1202は、仮係数レベルL'ijを入力し、その値情報ビット数であるRvalueを計算する。そして、ステップS104に移行する。
ステップS104で、Rposition 計算部1203は、StateFlag が0であるかを判断する。StateFlag が0である場合には、ステップS105に移行する。StateFlag が1である場合には、Rposition の値を0とする。そして、ステップS106に移行する。
ステップS105で、Rposition 計算部1203は、直交変換係数位置 (i, j)とStateFlag とを入力し、位置情報ビット数であるRposition を計算する。そして、ステップS106に移行する。
ステップS106で、高コスト係数レベル検出/除去部1204は、L'ij、Rvalue、およびRposition を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、Rposition がRvalueより大きい場合、L'ijを高コスト係数レベルとして検出し、Lij として0の値を出力する。すなわち、高コスト係数レベルの発生を防止する。そうでない場合には、仮係数レベルL'ijをLij として出力する。そして、ステップS107に移行する。
ステップS107で、状態変数更新部1205は、処理対象TUにおいて伝送順で先頭からN (≧2 )個前までに、有意な係数レベルが出力されたか否かを判断する。係数レベルは、適応量子化器1021における量子化を行う部分が出力する。1個以上の有意な係数レベルが出力された場合には、ステップS108に移行する。そうでない場合には、ステップS109に移行する。
ステップS108で、StateFlag 更新部1205は、StateFlag を1に更新する。そして、ステップS109に移行する。
ステップS109で、適応量子化器1021は、TUに含まれる全ての直交変換係数を量子化したか否かを判断する。全ての直交変換係数を量子化した場合には、TUの量子化処理が終了する。そうでない場合には、次の直交変換係数を量子化するために、ステップS101に移行する。
上述した適応量子化器1021を用いた本実施形態の映像符号化装置は、値情報のビット数と位置情報のビット数とを考慮して直交変換係数の係数レベルを決定する(高コスト係数レベルを検出/除去する)ことによって、高コスト係数レベルの発生を防止できる。また、適応量子化器1021は、伝送順でTUの先頭からN ≧ 2 )個前までの係数レベルを用いて各有意係数レベルの位置情報のビット数を計算することによって、連続するN(≧2)個の仮係数レベルに対して同時に高コスト係数レベルを検出/除去できる。つまり、本実施形態の映像符号化装置は、値情報のビット数と位置情報のビット数とを考慮して伝送順で連続する複数の係数レベルを同時に決定することにより、圧縮効率低下防止と複数直交変換係数の並列量子化処理を両立できる。
図4 は、伝送順で連続する直交変換係数Kij を並列処理する適応量子化器1021の構成例を示すブロック図である。図4 に示す適応量子化器1021は、2つの係数レベル決定部110A,110Bと、2つの状態変数更新部(StateFlag 更新部)1205A ,1205B と、分配器111 と多重器112 とを備える。
以下、 4×4 TUの場合の適応量子化器1021の動作を説明する。
分配器111 は、伝送順で連続する2つの直交変換係数Kij とそれらの直交変換係数位置 (i, j)を入力とし、それぞれの直交変換係数Kij と直交変換係数位置(i, j)を後続の係数レベル決定部110A,110Bに分配する。具体的には、伝送順で連続するK33 、K32 と、それらの直交変換係数位置 (3, 3)、(3, 2)が入力されると、係数レベル決定部110AにK33 と(3, 3)とを出力し、係数レベル決定部110BにK32 と(3, 2)とを出力する(出力先が逆でもよい。)。この分配処理を伝送順にTU内の全ての直交変換係数に行う。
係数レベル決定部110A,110Bは、係数レベル決定部110 と同様に動作する。状態変数更新部(StateFlag 更新部)1205A ,1205B は、状態変数更新部(StateFlag 更新部)1205と同様に動作する。
多重器112 は、2つの係数レベル決定部110A,110Bから出力された係数レベルLij を入力とし、伝送順に並べ替えて2つの係数レベルを出力する。具体的には、2つの係数レベル決定部110A,110Bから出力されたL33 、L32 を入力とし、伝送順に並び替えて、L33 、L32 の順に出力する。この処理を伝送順にTU内の全ての直交変換係数について行う。
実施形態2.
図5 は、本発明による映像符号化装置の第2の実施形態を示すブロック図である。第2の実施形態では、映像符号化装置は、高コスト係数レベルの検出の際に、値情報ビット数、位置情報ビット数、および2乗誤差削減量を用いる。
図5 は、本発明による映像符号化装置の第2の実施形態を示すブロック図である。第2の実施形態では、映像符号化装置は、高コスト係数レベルの検出の際に、値情報ビット数、位置情報ビット数、および2乗誤差削減量を用いる。
図5 に示す映像符号化装置は、第1の実施形態と比較すると、適応量子化器1021において、2乗誤差削減量計算部(D 計算部)1206が追加されている。すなわち、係数レベル決定部110において、2乗誤差削減量計算部1206が追加される。また、第2の実施形態では、適応量子化器1021の高コスト係数レベル検出/除去部1204は、L'ij、Rvalue、Rposition 、および2乗誤差削減量D を入力し、係数レベルLij を出力する。
2乗誤差削減量計算部1206と高コスト係数レベル検出/除去部1204を説明する。
2乗誤差削減量計算部1206は、直交変換係数Kij 、量子化パラメータQP、およびL'ijとを入力し、2乗誤差削減量D を出力する。2乗誤差削減量Dは、Kij に対する2乗誤差削減量である。本実施形態では、2乗誤差削減量計算部1206は、以下の(3)式に示すように、Kij 、Qs、およびL'ijを用いて、D を計算する。
D = (Kij − 0)2 −(Kij − Qs・L'ij)2 = 2・Kij ・Qs・L'ij−Qs2・L'ij2 (3)
高コスト係数レベル検出/除去部1204は、L'ij、Rvalue、Rposition 、およびD を入力し、係数レベルLij を出力する。高コスト係数レベル検出/除去部1204は、RvalueとRpositionとの和とλの積が、2乗誤差削減量D 以上の場合には、L'ijを高コスト係数レベルと判断し、0の値をLij として出力する。L'ijが高コスト係数レベルではない場合には、L'ijをLij として出力する。なお、λは、2乗誤差削減量と伝送符号量との関係の勾配である。λは、量子化パラメータQPに依存し、量子化パラメータが小さくなるほど(量子化ステップサイズが小さくなるほど)小さな値となり、量子化パラメータが大きくなるほど(量子化ステップサイズが大きくなるほど)大きな値となる。λは、一様量子化の場合、Qsを用いて、以下の(4)式で示される。
次に、図6 のフローチャートを参照して、本実施形態の適応量子化器の動作を説明する。
適応量子化器1021は、TU毎に、TU内の各直交変換係数Kij (0 ≦ i, j ≦ 3) に対して、伝送順 (例えば、4x4TUの場合には、(3, 3)→(3, 2)→(2, 3)→(3, 1)→(2, 2)→(1, 3)→(3, 0)→(2, 1)→(1, 2)→(0, 3)→(2, 0)→(1, 1)→(0, 2)→(1, 0)→(0, 1)→(0, 0)の順)に以下のように動作する。
ステップS201で、係数レベル計算部1201は、上記の(1)式を用いて、直交変換係数Kij と量子化パラメータQPとを入力し、仮係数レベルL'ijを出力する。
ステップS202で、係数レベル計算部1201は、L'ijの値が0でないかを判断する。L'ijの値が0でない場合には、ステップS203に移行する。L'ijの値が0である場合には、係数レベル計算部1201は、Lij =L'ijとする(ステップS211)。そして、ステップS207に移行する。
ステップS203で、Rvalue計算部1202は、仮係数レベルL'ijを入力し、その値情報ビット数であるRvalueを計算する。そして、ステップS204に移行する。
ステップS204で、Rposition 計算部1203は、StateFlag が0であるかを判断する。StateFlag が0である場合には、ステップS205に移行する。StateFlag が1である場合には、Rposition 計算部1203は、Rposition の値を0とする。そして、ステップS206に移行する。
ステップS205で、Rposition 計算部1203は、直交変換係数位置 (i, j)とStateFlag とを入力し、位置情報ビット数であるRposition を計算する。そして、ステップS206に移行する。
ステップS206で、2乗誤差削減量計算部1206は、直交変換係数に対する2乗誤差削減量であるD を計算する。そして、ステップS207に移行する。
ステップS207で、高コスト係数レベル検出/除去部1204は、Rposition とRvalueとの和とλの積が、D 以上の場合には、L'ijを高コスト係数レベルと判断し、0の値をLij として出力する。L'ijが高コスト係数レベルではない場合には、高コスト係数レベル検出/除去部1204は、L'ijをLij として出力する。そして、ステップS208に移行する。
ステップS208で、状態変数更新部1205は、処理対象TUにおいて伝送順で先頭からN (≧2 )個前までに、有意な係数レベルが出力されたか否かを判断する。1個以上の有意な係数レベルが出力された場合には、ステップS209に移行する。そうでない場合には、ステップS210に移行する。
ステップS209で、StateFlag 更新部1205は、StateFlagを1に更新する。そして、ステップS210に移行する。
ステップS210において、適応量子化器1021は、TUに含まれる全ての直交変換係数を量子化したか否かを判断する。全ての直交変換係数を量子化した場合には、TUの量子化処理が終了する。そうでない場合には、次の直交変換係数を量子化するために、ステップS201に移行する。
上記の各実施形態では、すべての値の有意な仮係数レベルに対して、高コスト係数レベル検出/除去が適用される。しかし、すべての値の有意な仮係数レベルに対してではなく、小さな値(例えば、絶対値で1や2)の有意な仮係数レベルに対してのみ高コスト係数レベル検出/除去を適用してもよい。なぜなら、小さな値の有意係数レベルが高コスト係数レベルになる傾向があるためである。小さな値の有意な仮係数レベルを対象にすることによって、例えば誤って大きな値の係数レベルを0とすることに起因する画質劣化を抑制できる。また、映像符号化処理をソフトウェアで実現する場合には、高コスト係数レベル検出/除去を適用する回数が統計的に削減されるので、量子化処理時間を短縮できる。
また、上記の各実施形態では、TU内のすべての値の有意な仮係数レベルに対して、高コスト係数レベル検出/除去が適用される。しかし、TU内で処理済みの仮係数レベルと係数レベルの差分の絶対値和が所定のしきい値以下となる場合に、TU内の残りの有意な仮係数レベルに対して高コスト係数レベル検出/除去を適用してもよい。こうすることによって、例えば誤って多くの小さな値の有意係数レベルを0とすることに起因する画質劣化を抑制できる。また、映像符号化処理をソフトウェアで実現する場合には、高コスト係数レベル検出/除去を適用する回数が統計的に削減されるので、量子化処理時間を短縮できる。なお、絶対値和は、高コスト係数レベル検出/除去部で、容易に計算される。
なお、上記の各実施形態において、伝送順で先頭から処理対象のN (N ≧2 )個前までに量子化器が有意係数レベルを出力したか否かの情報を用いる高コスト係数レベル検出/除去が適用されるが、そのような高コスト係数レベル検出/除去は、処理対象直前のN-1 個の係数レベルの値を0とみなした情報を用いることと等価である。
また、上記の各実施形態を、ハードウェアで構成することも可能であるが、コンピュータプログラムにより実現することも可能である。
図7 に示す情報処理システムは、プロセッサ1001、プログラムメモリ1002、映像データを格納するための記憶媒体1003およびビットストリームを格納するための記憶媒体1004を備える。記憶媒体1003と記憶媒体1004とは、別個の記憶媒体であってもよいし、同一の記憶媒体からなる記憶領域であってもよい。記憶媒体として、ハードディスク等の磁気記憶媒体を用いることができる。
図7 に示された情報処理システムにおいて、プログラムメモリ1002には、図1 に示された各ブロックの機能を実現するためのプログラムが格納される。そして、プロセッサ1001は、プログラムメモリ1002に格納されているプログラムに従って処理を実行することによって、図1 に示された映像符号化装置の機能を実現する。
図8 は、本発明による映像符号化装置の主要部を示すブロック図である。図8 に示すように、本発明による映像符号化装置は、画像ブロックを直交変換して直交変換係数を計算する直交変換部11と、直交変換係数を量子化して係数レベルを計算する量子化部12と、係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化部13とを備え、量子化部12は、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する値情報ビット数計算部と、画像ブロックにおいて伝送順で先頭からN 個前までに量子化部が出力した係数レベルを監視して、少なくともその一つが有意であるか否かを示す状態変数を更新する状態変数更新部と、処理対象とする直交変換係数の位置と状態変数とに基づいて、処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する位置情報ビット数計算部と、値情報ビット数と位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする高コスト係数レベル検出/除去部とを含む。
上記の実施形態の一部又は全部は以下の付記のようにも記載されうるが、本発明の構成は以下の構成に限定されない。
(付記1)画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、前記直交変換係数を量子化して係数レベルを計算する量子化手段と、前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備える映像符号化装置であって、前記量子化手段は、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、画像ブロックにおいて伝送順で先頭からN 個前までに前記量子化手段が出力した係数レベルを監視して、少なくともその一つが有意であるか否かを示す状態変数を更新する状態変数更新手段と、前記処理対象とする直交変換係数の位置と前記状態変数とに基づいて、前記処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する位置情報ビット数計算手段と、前記値情報ビット数と前記位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする高コスト係数レベル検出/除去手段とを含むことを特徴とする映像符号化装置。
(付記2)画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、前記直交変換係数を量子化して係数レベルを計算する量子化手段と、前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備える映像符号化装置であって、前記量子化手段は、画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、画像ブロックにおいて伝送順で先頭から直前までに前記量子化手段が出力した係数レベルを監視して、直前のN-1 個の係数レベル以外の少なくとも一つが有意であるか否かを示す状態変数を更新する状態変数更新手段と、前記処理対象とする直交変換係数の位置と前記状態変数とに基づいて、前記処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する位置情報ビット数計算手段と、前記値情報ビット数と前記位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする高コスト係数レベル検出/除去手段とを含むことを特徴とする映像符号化装置。
(付記3)前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数が前記値情報ビット数よりも多い場合に、有意係数レベルを0にする付記1または付記2の映像符号化装置。
(付記4)前記量子化手段は、量子化パラメータ、前記有意な係数レベル、および前記直交変換係数を用いて、直交変換係数に対する2乗誤差削減量を計算する2乗誤差削減量計算手段を含み、前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる有意係数レベルを0にする付記1または付記2の映像符号化装置。
以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
この出願は、2013年6月11日に出願された日本特許出願2013−122400を基礎とする優先権を主張し、その開示の全てをここに取り込む。
11 直交変換部
12 量子化部
13 エントロピー符号化部
101 周波数変換器
1021 適応量子化器
103 エントロピー符号化器
104 逆周波数変換/逆量子化器
105 バッファ
106 予測器
107 推定器
110 ,110A,110B 係数レベル決定部
1001 プロセッサ
1002 プログラムメモリ
1003 記憶媒体
1004 記憶媒体
1201 係数レベル計算部
1202 値情報ビット数計算部(Rvalue計算部)
1203 位置情報ビット数計算部(Rposition 計算部)
1204 高コスト係数レベル検出/除去部
1205,1205A ,1205B 状態変数更新部(StateFlag 更新部)
1206 2乗誤差削減量計算部(D 計算部)
12 量子化部
13 エントロピー符号化部
101 周波数変換器
1021 適応量子化器
103 エントロピー符号化器
104 逆周波数変換/逆量子化器
105 バッファ
106 予測器
107 推定器
110 ,110A,110B 係数レベル決定部
1001 プロセッサ
1002 プログラムメモリ
1003 記憶媒体
1004 記憶媒体
1201 係数レベル計算部
1202 値情報ビット数計算部(Rvalue計算部)
1203 位置情報ビット数計算部(Rposition 計算部)
1204 高コスト係数レベル検出/除去部
1205,1205A ,1205B 状態変数更新部(StateFlag 更新部)
1206 2乗誤差削減量計算部(D 計算部)
Claims (9)
- 画像ブロックを直交変換して直交変換係数を計算する直交変換手段と、
前記直交変換係数を量子化して係数レベルを計算する量子化手段と、
前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力するエントロピー符号化手段とを備える映像符号化装置であって、
前記量子化手段は、
画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する値情報ビット数計算手段と、
画像ブロックにおいて伝送順で先頭からN 個前までに前記量子化手段が出力した係数レベルを監視して、少なくともその一つが有意であるか否かを示す状態変数を更新する状態変数更新手段と、
前記処理対象とする直交変換係数の位置と前記状態変数とに基づいて、前記処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する位置情報ビット数計算手段と、
前記値情報ビット数と前記位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする高コスト係数レベル検出/除去手段とを含む
ことを特徴とする映像符号化装置。 - 前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数が前記値情報ビット数よりも多い場合に、有意係数レベルを0にする
請求項1記載の映像符号化装置。 - 前記量子化手段は、量子化パラメータ、前記有意な係数レベル、および前記直交変換係数を用いて、直交変換係数に対する2乗誤差削減量を計算する2乗誤差削減量計算手段を含み、
前記高コスト係数レベル検出/除去手段は、前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる有意係数レベルを0にする
請求項1記載の映像符号化装置。 - 画像ブロックを直交変換して直交変換係数を計算し、
前記直交変換係数を量子化して係数レベルを計算し、
前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する映像符号化方法であって、
前記係数レベルを計算する際に、
画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算し、
画像ブロックにおいて伝送順で先頭からN 個前までの係数レベルのうちの少なくとも一つが有意であるか否かを示す状態変数を更新し、
前記処理対象とする直交変換係数の位置と前記状態変数とに基づいて、前記処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算し、
前記値情報ビット数と前記位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする
ことを特徴とする映像符号化方法。 - 前記位置情報ビット数が前記値情報ビット数よりも多い場合に、有意係数レベルを0にする
請求項4記載の映像符号化方法。 - 前記係数レベルを計算する際に、量子化パラメータ、前記有意な係数レベル、および前記直交変換係数を用いて、直交変換係数に対する2乗誤差削減量を計算し、
前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる有意係数レベルを0にする
請求項4記載の映像符号化方法。 - コンピュータに、
画像ブロックを直交変換して直交変換係数を計算する処理と、
前記直交変換係数を量子化して係数レベルを計算する処理と、
前記係数レベルのうちすべての有意係数レベルの位置情報をエントロピー符号化した後に、それぞれの前記有意係数レベルの値情報をエントロピー符号化してビットストリームを出力する処理とを実行させ、
前記係数レベルを計算する処理で、
画像ブロックにおいて処理対象とする直交変換係数の有意係数レベルの値情報ビット数を計算する処理と、
画像ブロックにおいて伝送順で先頭からN 個前までの係数レベルのうちの少なくとも一つが有意であるか否かを示す状態変数を更新する処理と、
前記処理対象とする直交変換係数の位置と前記状態変数とに基づいて、前記処理対象とする直交変換係数の有意係数レベルの位置情報ビット数を計算する処理と、
前記値情報ビット数と前記位置情報ビット数とが所定の条件を満たす有意係数レベルを0にする処理とを
実行させるための映像符号化プログラム。 - コンピュータに、
前記位置情報ビット数が前記値情報ビット数よりも多い場合に、有意係数レベルを0にする処理を実行させるための請求項7記載の映像符号化プログラム。 - コンピュータに、
前記係数レベルを計算する処理で、量子化パラメータ、前記有意な係数レベル、および前記直交変換係数を用いて、直交変換係数に対する2乗誤差削減量を計算する処理を実行させ、
前記位置情報ビット数、前記値情報ビット数、および前記2乗誤差削減量を用いて、前記2乗誤差削減量が、前記位置情報ビット数と前記値情報ビットとの和に対して所定の乗数を乗じた値以下となる有意係数レベルを0にする処理を実行させる
ための請求項7記載の映像符号化プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014541455A JP5644987B1 (ja) | 2013-06-11 | 2014-04-22 | 映像符号化装置、映像符号化方法および映像符号化プログラム |
Applications Claiming Priority (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013122400 | 2013-06-11 | ||
JP2013122400 | 2013-06-11 | ||
PCT/JP2014/002252 WO2014199551A1 (ja) | 2013-06-11 | 2014-04-22 | 映像符号化装置、映像符号化方法および映像符号化プログラム |
JP2014541455A JP5644987B1 (ja) | 2013-06-11 | 2014-04-22 | 映像符号化装置、映像符号化方法および映像符号化プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP5644987B1 true JP5644987B1 (ja) | 2014-12-24 |
JPWO2014199551A1 JPWO2014199551A1 (ja) | 2017-02-23 |
Family
ID=52021876
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014541455A Expired - Fee Related JP5644987B1 (ja) | 2013-06-11 | 2014-04-22 | 映像符号化装置、映像符号化方法および映像符号化プログラム |
Country Status (6)
Country | Link |
---|---|
US (1) | US10045033B2 (ja) |
EP (1) | EP3010230A4 (ja) |
JP (1) | JP5644987B1 (ja) |
KR (1) | KR101645911B1 (ja) |
BR (1) | BR112015030096A2 (ja) |
WO (1) | WO2014199551A1 (ja) |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8891615B2 (en) * | 2008-01-08 | 2014-11-18 | Qualcomm Incorporated | Quantization based on rate-distortion modeling for CABAC coders |
JP2010087771A (ja) * | 2008-09-30 | 2010-04-15 | Nec Electronics Corp | 画像符号化装置及び方法 |
WO2011080806A1 (ja) * | 2009-12-28 | 2011-07-07 | 富士通株式会社 | 動画像符号化装置および動画像復号装置 |
US9042440B2 (en) * | 2010-12-03 | 2015-05-26 | Qualcomm Incorporated | Coding the position of a last significant coefficient within a video block based on a scanning order for the block in video coding |
US8446301B2 (en) * | 2011-04-15 | 2013-05-21 | Research In Motion Limited | Methods and devices for coding and decoding the position of the last significant coefficient |
-
2014
- 2014-04-22 WO PCT/JP2014/002252 patent/WO2014199551A1/ja active Application Filing
- 2014-04-22 JP JP2014541455A patent/JP5644987B1/ja not_active Expired - Fee Related
- 2014-04-22 EP EP14810729.5A patent/EP3010230A4/en not_active Withdrawn
- 2014-04-22 US US14/888,976 patent/US10045033B2/en not_active Expired - Fee Related
- 2014-04-22 BR BR112015030096A patent/BR112015030096A2/pt not_active IP Right Cessation
- 2014-04-22 KR KR1020157035076A patent/KR101645911B1/ko active IP Right Grant
Also Published As
Publication number | Publication date |
---|---|
JPWO2014199551A1 (ja) | 2017-02-23 |
KR20160006767A (ko) | 2016-01-19 |
EP3010230A1 (en) | 2016-04-20 |
US10045033B2 (en) | 2018-08-07 |
WO2014199551A1 (ja) | 2014-12-18 |
EP3010230A4 (en) | 2016-11-16 |
KR101645911B1 (ko) | 2016-08-04 |
BR112015030096A2 (pt) | 2017-07-25 |
US20160119630A1 (en) | 2016-04-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11943485B2 (en) | Method of coding and decoding images, coding and decoding device and computer programs corresponding thereto | |
JPWO2018123313A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
KR20100102386A (ko) | 레지듀얼 값 분포에 적응적인 부호표 선택에 기초한 영상 부호화, 복호화 방법 및 장치 | |
WO2011083666A1 (ja) | 符号化装置、復号装置、および、データ構造 | |
WO2016194380A1 (ja) | 動画像符号化装置、動画像符号化方法および動画像符号化プログラムを記憶する記録媒体 | |
JPWO2018123314A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
JP6176044B2 (ja) | ブロック構造決定回路および情報圧縮回路 | |
JP5574072B1 (ja) | 映像符号化装置、映像符号化方法および映像符号化プログラム | |
JP6248783B2 (ja) | 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム | |
JP5644987B1 (ja) | 映像符号化装置、映像符号化方法および映像符号化プログラム | |
JPWO2018123312A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
JPWO2018123315A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
WO2015045301A1 (ja) | 映像符号化装置、映像符号化方法および映像符号化プログラム | |
JPWO2018123317A1 (ja) | 映像符号化方法、映像復号方法、映像符号化装置、映像復号装置及びプログラム | |
KR20170124076A (ko) | 영상 신호 그룹의 부호화 및 복호화 방법과 장치 | |
KR20170124078A (ko) | 영상 신호 부호화/복호화 방법 및 장치 | |
KR20040084328A (ko) | 중간 데이터에 기초한 적응적 인트라 매크로블록 갱신 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A975 | Report on accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A971005 Effective date: 20141001 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20141007 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20141020 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 5644987 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |