JP2015043524A - レート歪コスト推定装置及びプログラム - Google Patents

レート歪コスト推定装置及びプログラム Download PDF

Info

Publication number
JP2015043524A
JP2015043524A JP2013174745A JP2013174745A JP2015043524A JP 2015043524 A JP2015043524 A JP 2015043524A JP 2013174745 A JP2013174745 A JP 2013174745A JP 2013174745 A JP2013174745 A JP 2013174745A JP 2015043524 A JP2015043524 A JP 2015043524A
Authority
JP
Japan
Prior art keywords
rate
distortion
coefficient
pixel block
calculating
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2013174745A
Other languages
English (en)
Inventor
敏 後藤
Satoshi Goto
敏 後藤
哲 盛
Zhe Sheng
哲 盛
大江 周
Dajiang Zhou
大江 周
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Waseda University
Original Assignee
Waseda University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Waseda University filed Critical Waseda University
Priority to JP2013174745A priority Critical patent/JP2015043524A/ja
Publication of JP2015043524A publication Critical patent/JP2015043524A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】HEVCイントラ予測に適応可能な計算複雑度の小さいレート歪コスト推定装置の提供。【解決手段】符号化画像のビットコストを推定演算するレート推定手段と、歪み量を量子化係数画像に基づき推定演算する歪み推定手段とを備え、レート推定手段は、符号化画像のヘッダ部を除く符号化係数部分のビット数の推定値Bcoefを算出する係数レート演算手段を備え、該係数レート演算手段は、量子化係数画像の各量子化係数qi,jに対し、推定値Bcoefを次式により演算する。【数1】【選択図】図2

Description

本発明は、映像圧縮において、主にイントラ予測の予測モードの選択を行う際の選定基準等として使用されるレート歪コストを推定する技術に関する。
高効率映像符号化(High Efficiency Video Coding :HEVC)は、JCT−VCにより制定された現在最新の映像符号化規格である(非特許文献1)。HEVCでは、可変サイズの符号化ユニット(Coding Unit:CU)、予測ユニット(Prediction Unit:PU)、及び変換ユニット(Transform Unit:TU)を用いたフレキシブルな四分木符号化構造(quadra-tree coding structure)が新たに採用された。また、イントラ予測においても幾つかの新しい特徴がある。符号化ユニットのサイズは、64×64画素から8×8画素まで変化させることができ、また33種類の方向性予測にDC予測、Planer予測を加えた最大35種類の予測モードが定義されている。レート歪最適化(rate-distortion optimization:RDO)の結果であるレート歪Lagrangeコスト(以下「RDコスト」という。)は、上記CU,PU,TUの最適な予測モード及び最適なサイズを選ぶための選定基準となる。HEVCは、1世代前の映像符号化規格であるH.264/AVCに比べて遥かに多くの予測モードがあるため、圧縮率のRDOに対する依存性はより大きくなる。また、HEVCでは、従来のRDO-offモードは、十分な圧縮性能が得られないという理由で、HEVCテストモデル(HM)には含まれていない。従って、HEVCエンコーダでは、計算複雑度の大きいRDOの逐次処理を高速に実行するためのアルゴリズムとハードウェア実装が極めて重要である。特に、イントラ予測では、隣接するブロック間の相関が大きく、RDコスト計算が頻繁に実行されるため、インター予測よりもRDOが重要である。そこで、効率的にRDコストを計算するアルゴリズムとできるだけ簡略化されたRDO構造が不可欠となる。
従来のH.264/AVCにおいては、計算複雑度の小さいアルゴリズムを用いてレート及び歪みを推定することで、RDO計算を簡素化するのを試みた研究が幾つか公開されている。非特許文献2では、符号化係数の分布モデルとして一般化されたGaussian分布を使用したレート推定器が開示されている。非特許文献3では、前記符号化係数の分布モデルとして、Cauchy密度関数を使用することが提案されている。非特許文献4では、レート制御のためにSATD(Sum of absolute transformed differences)モデルを採用した例が開示されている。非特許文献5では、係数のlノルムと変換領域での歪みを使用した、効率的なRDコストの推定手法が開示されている。また、非特許文献6では、変換係数の非ゼロ係数の座標を、レート推定のモデル化に役立てる手法が開示されている。
特開2006−523911公報 特開2007−174649公報 特開2010−539750公報 特開2011−509642公報
G. J. Sullivan, J.-R. Ohm, W.-J. Han, T. Wiegand, and T. Wiegand, "Overview of the high efficiency video coding (hevc) standard," Circuits and Systems for Video Technology, IEEE Transactions on, vol. 22, no. 12, pp. 1649 -1668, Dec. 2012. Xin Zhao, Jun Sun, Siwei Ma, and Wen Gao, "Novel statistical modeling, analysis and implementation of rate-distortion estimation for h.264/avc coders," Circuits and Systems for Video Technology, IEEE Transactions on, vol. 20, no. 5, pp. 647 -660, May 2010. N. Kamaci, Y. Altunbasak, and R.M. Mersereau, "Frame bit allocation for the h.264/avc video coder via cauchy-density-based rate and distortion models," Circuits and Systems for Video Technology, IEEE Transactions on, vol. 15, no. 8, pp. 994 - 1006, Aug. 2005. Do-Kyoung Kwon, Mei-Yin Shen, and C.-CJ. Kuo, "Rate control for h.264 video with enhanced rate and distortion models," Circuits and Systems for Video Technology, IEEE Transactions on, vol. 17, no. 5, pp. 517-529, May 2007. Yu-Kuang Tu, Jar-Ferr Yang, and Ming-Ting Sun, "Efficient rate-distortion estimation for h.264/avc coders," Circuits and Systems for Video Technology, IEEE Transactions on, vol. 16, no. 5, pp. 600 - 611, May 2006. Qiang Wang, D. Zhao, Wen Gao, and Siwei Ma, "Low complexity rdo mode decision based on a fast coding-bits estimation model for h.264/avc," in Circuits and Systems, 2005. ISCAS 2005. IEEE International Symposium on, May 2005, pp. 3467 - 3470 Vol. 4. JCT-VC, "High efficiency video coding (hevc) test model 8 encoder description," JCTVC-J1002, Jul. 2012. JCT-VC, "High efficiency video coding (hevc) text specification draft 8," JCTVC-J1003A7, Jul. 2012. D. Bardone, E.S.G. Carotti, and J.C. De Martin, "Adaptive golomb codes for level binarization in the h.264/avc frext lossless mode," in Signal Processing and Information Technology, 2008. ISSPIT 2008. IEEE International Symposium on, Dec. 2008, pp. 287 -291. JCT-VC, "Common test conditions and software reference configurations," JCTVC-E700, Jan. 2011. G.A.F. Seber and C.J. Wild, Nonlinear Regression, Wiley Series in Probability and Statistics. Wiley, 2003. G. BJONTEGARD, "Calculation of average psnr differences between rd-curves," ITU-T VCEG-M33, Apr. 2001.
しかしながら、上記従来公知の手法は、何れも、主として4×4画素サイズのTUを前提としているものである。それに対して、HEVCでは、TUのサイズは4×4画素から32×32画素まで採り得るため、上記従来の手法を直接HEVCに適用することはできない。
そこで、本発明の目的は、HEVCイントラ予測に適応可能な、計算複雑度の小さいレート歪コスト推定装置を提供することにある。
本発明に係るレート歪コスト推定装置の第1の構成は、オリジナルの入力画素ブロックの予測符号化によって得られる残差画素ブロックを変換符号化し量子化して得られた量子化変換係数からなる量子化係数画素ブロックに対し、レート歪コストを推定演算するレート歪コスト推定装置であって、
前記量子化係数画素ブロックを記憶する符号化画素記憶手段と、
前記符号化画素記憶手段に記憶された前記量子化係数画素ブロックをエントロピ符号化して得られる符号化画素ブロックのビットコストを、当該量子化係数画素ブロックに基づき推定演算するレート推定手段と、
前記量子化係数画素ブロックを逆量子化及び逆変換し前記予測画像を加算することで再構成して得られる再構成画素ブロックとオリジナルの前記入力画素ブロックとの間の歪み量を、前記符号化画素記憶手段から読み出される前記量子化係数画素ブロックに基づき推定演算する歪み推定手段と、
前記レート推定手段が算出するレート推定値に所定の定数を掛けた値と、前記歪み推定手段が算出する歪み量推定値との和であるレート歪コストを算出するレート歪コスト演算手段と、を備え、
前記レート推定手段は、
前記符号化画素ブロックのヘッダ部のビット数の推定値Bhdrを算出するヘッダレート演算手段と、
前記符号化画素ブロックのヘッダ部を除く符号化係数部分のビット数の推定値Bcoefを算出する係数レート演算手段と、
前記ヘッダレート演算手段が算出する前記推定値Bhdr及び前記係数レート演算手段が算出する前記推定値Bcoefの和であるレート推定値Bmodeを算出する全レート演算手段と、を備え、
前記係数レート演算手段は、当該量子化係数画素ブロックの前記各量子化係数qi,jに対し、前記推定値Bcoefを次式により演算することを特徴とする。
この構成によれば、符号化画像の符号化係数部分のレートの推定演算において、エントロピ符号化を行うことなくレートの推定値Bcoefを算出するため、RDコスト計算の時間を大幅に削減することが可能となる。ハードウェア実装に不親和なエントロピ符号化を行わないため、ハードウェア実装におけるデータ依存性を軽減させることができる。
尚、本発明に係るレート歪コスト推定装置は、HEVCに限らず、H.264/AVCや他の方式の映像シーケンスの符号化方式に対しても適用することが出来る。また、イントラ予測におけるレート歪コスト計算に限らす、インター予測や他のモードのフィルタに対しても適用することが出来る。
また、本発明に係るレート歪コスト推定装置の第2の構成は、前記第1の構成に於いて、前記歪み推定手段は、
前記残差画素ブロックを変換符号化して得られる各変換係数yi,jをスケーリングしたスケーリング変換係数si,jを算出する変換係数スケーリング手段と、
前記スケーリング変換係数si,j,前記量子化係数qi,j,及び所定の量子化パラメータ及び画素ブロックのサイズに対して予め定められているビットシフト数iQBitsに対し、(数2)によりスケーリングされた量子化歪みの推定値Dqsを算出する量子化歪み推定手段と、
前記量子化歪みの推定値Dqsから、(数3)により前記入力画素ブロックの全体の歪み量Dを算出する全歪み推定手段と、を備えたことを特徴とする。
この構成により、入力画素ブロックの全体の歪み量Dを算出する過程において、従来歪み量の計算に必要であった、量子化係数画像の逆量子化、逆変換、再構成といった処理を省略することができるため、RDコスト計算の時間を大幅に削減することが可能となる。また、ハードウェア実装に不親和な再構成を含むモジュールを省略することができ、ハードウェア実装におけるデータ依存性を軽減させることができる。
また、本発明に係るプログラムは、コンピュータに読み込ませて実行することにより、当該コンピュータを前記第1又は2の構成のレート歪コスト推定装置として機能させることを特徴とする。
以上のように、本発明のレート歪コスト推定装置によれば、イントラ予測において、適切なレート推定モデルと歪み推定モデルに基づき、許容できる範囲内の画質劣化・ビットレート増加で、RDコスト計算の時間を大幅に削減することが可能となる。
また、ハードウェア実装においては、本発明のレート歪コスト推定装置を用いることにより、RDコスト計算においてハードウェア実装に不親和なエントロピ符号化及び再構成を含むモジュールを省略することができ、ハードウェア実装におけるデータ依存性を軽減させることができる。
尚、本発明のレート歪コスト推定装置は、インター予測に対しても適用することができ、他のモードのフィルタ・アルゴリズムとともに動作させることができる。
通常のRDOに基づくレート歪コスト計算装置の構成を表すブロック図である。 本発明に係るレート歪コスト推定装置の構成を表すブロック図である。 図1のレート歪コスト計算装置100で計算される実際の符号化ビットコストBcoefとθ=1の場合の推定ビット消費量Eposとの関係を示す図である。 実際の符号化ビットコストBcoefと推定符号化ビットコストB^coefとの関係を示す図である。 全体の歪みDとスケーリングされた量子化歪みDqsとの関係を示す図である。
以下、本発明を実施するための形態について、図面を参照しながら説明する。
(1)全体構成
まず、従来のレート歪コスト計算装置について説明する。図1に、通常のRDOに基づくレート歪コスト計算装置の構成を示す。図1において、破線の領域はレート歪コスト計算部100を示す。灰色の幅広線は、レート及び歪み計算により遅延する部分を示している。図1のレート歪コスト計算装置では、イントラ予測におけるレート歪コストの計算を行う。
イントラ予測器102は、フレームメモリ101に記憶されたオリジナル画素は、指定されたPUサイズ及び予測モードによりイントラ予測を行い、PU内の各画素に対する残差を計算し残差画素記憶部103に格納する。
レート歪コスト計算部100において、まず、変換部104は、残差画素記憶部103に格納されたPU内の残差に対し変換(DCT等)を行い、変換係数yijを算出する。次に、量子化部105は変換係数yijを量子化し、量子化変換係数qijを算出し、符号化画素記憶部106に格納する。
レートの計算は、エントロピ符号化部107が符号化画素記憶部106に格納された量子化変換係数qijをエントロピ符号化し、得られた符号列のビットサイズ(符号化ビットコスト)Bmodeをレート計算部108が計算することによって実行される。
一方、歪みの計算は、まず逆量子化部109が符号化画素記憶部106に格納された量子化変換係数qijを逆量子化し、変換係数y~ijを算出する(ここで、記号「~」は直前の記号の上にティルド記号が付されることを表す。以下同じ)。変換係数y~ijは量子化誤差による歪みを含んでいる。次いで、逆変換部110が変換係数y~ijを逆変換して残差を算出し、再構成部111が当該残差に予測値を加算することにより再構成画素を算出して再構成画素記憶部112に格納する。そして、減算器113はそれぞれのオリジナル画素に対して、再構成画素記憶部112に格納された対応する再構成画素を減算し誤差を算出して歪み計算部114に出力する。歪み計算部114は、減算器113が出力する残差の二乗誤差を加算し、PU全体の歪みの二乗誤差和SSEが算出される。
最後に、レート歪計算部115は、符号化ビットコストBmodeに所定のLagrange係数λmodeを掛けた値と歪みの二乗誤差和SSEとを加算してレート歪Jmodeを算出する。
HEVCのイントラ予測では、PUのサイズは64×64画素から4×4画素まで変化し得る。各サイズのPUについて35種類の予測モードについてレート歪Jmodeを計算することで、レート歪が小さくなる幾つかの候補予測モードが選択される(非特許文献7参照)。そして、選択された候補予測モードの其々に対し次式で算出されるRDコストJmodeを算出し、RDコストJmodeが最小となる予測モードを最適な予測モードとされる(非特許文献7参照)。
ここで、SSEはオリジナル画素と再構成画素との二乗差の和(sum of square error)、BmodeはCABACによるすべてのブロックの符号化ビットコストである。このRDコストJmodeは、CUサイズ、PUサイズ、及びTUサイズを決定する際の基準でもある。
表1に、PUの各サイズに対するフルRDOの候補予測モードの数を示す。候補予測モードは、上側及び左側のブロックの予測モードから算出される場合もあるので、候補予測モードの数は変化する。表1の通り、RDコストの計算を行う少数の候補予測モードのみが選出されるが、依然としてレート歪最適化プロセスは、大きな計算複雑度となる。
そこで、本発明では図1のレート歪コスト計算を簡略化し計算複雑度を減少させる。図1において、変換部104,量子化部105,逆量子化部109,及び逆変換部110を含む一連のモジュールは、強いデータ依存性を示すが、ハードウェア実装においては並列化及びパイプライン化は比較的容易である。一方、エントロピ符号化部107は、変換係数がシーケンシャルに処理されるため、ハードウェア実装には不利である。
図2に、本発明に係るレート歪コスト推定装置の構成を表すブロック図を示す。図2において、フレームメモリ101、イントラ予測器102、残差画素記憶部103、変換部104、量子化部105、及びレート歪計算部115は、図1の同符号の構成要素と同じものである。本発明に係るレート歪コスト推定装置1は、エントロピ符号化部107,レート計算部108に代えて簡易レート推定器2を備え、逆量子化部109,逆変換部110,再構成部111,再構成画素記憶部112,減算器113,歪み計算部114に代えて低複雑度歪み推定器3を備えた点が特徴である。簡易レート推定器2は、符号化画素のエントロピ符号化演算を行うことなく符号化ビットコストの推定演算を行うモジュールである。また、低複雑度歪み推定器3は、符号化画素の逆量子化・逆変換・再構成といった一連の復号演算を行うことなく歪み値の推定演算を行うモジュールである。レート歪計算部115は、簡易レート推定器2により算出される符号化ビットコストの推定値B^(ここで、記号「^」は直前の記号の上にハット記号が付されることを表す。以下同じ)と、低複雑度歪み推定器3により算出される歪みの二乗和の推定値D^とから、次式によってレート歪J^の推定値を算出する。
これによって、RDOの演算処理は簡易化され、ブロック間のデータ依存性が緩和され、ハードウェア実装において非常に大きな利便性がもたらされることになる。以下、簡易レート推定器2及び低複雑度歪み推定器3の詳細について説明する。
(2)簡易レート推定器2
(2.1)変換係数のレート
符号化ビットコストBmodeは、次式の通り、ヘッダのビット数Bhdrと係数のビット数Bcoefに分割できる。
量子化変換係数qij(i,j=0,…,N−1)のlノルムEは次式により定義される。ここで、NはPUの一辺の画素数である。
HEVCの規格書である非特許文献8で規定されている残差符号化構文によれば、係数ビットは、非ゼロ・マップ(nonzero map),1以上マップ(greater-than-one map),サイン(sign),残余レベル(remaining lavel)などから符号化される。特に重要なのは、残余レベルの二値化の際にGolomb-Rice法を用いることであり、高周波側の係数から低周波側の係数までスキャンするときにRiceパラメータcRPを増加させることができる。二値化のプレフィックス部分は、トランケーティド・ライス二値化処理(Truncated Rice binarization process)を実行することにより導出され、そのビン数は、
である。サフィックス部分はk次の指数ゴロム(Exponential Golomb:EGk)二値化処理を用いて導出され、そのビン数は
である(非特許文献9参照)。ここで、k=cRP+1である。
これらの方法に基づき、小さな残余レベルは、低い周波数位置において高い周波数位置よりも長いビンに符号化され、大きな残余レベルは、低い周波数位置において高い周波数位置よりも短いビンに符号化されるであろうと推定される。
そこで、まず、式(5)に非ゼロ係数の位置情報を追加することにより、ビット消費量Eposを次式のようにモデル化する。
ここで、θは位置情報に関するバランス・パラメータ(フィッティング・パラメータ)である。計算量を抑えるため、ここではp=1を選択する。また、実際の画像では変換係数はDC及び低周波側に集中しており、高周波側の係数の絶対値|qij|の殆どが0又は1である。従って、式(8)の|qij|は1で近似する。従って、ビット消費量Eposは次のように簡素化される。
図3は、図1のレート歪コスト計算装置100で計算される実際の符号化ビットコストBcoefとθ=1の場合の推定ビット消費量Eposとの関係を示す図である。実際の符号化ビットコストBcoefと推定ビット消費量Epos(θ=1)との間には強い相関があるが、両者は完全に線形な関係ではない。また、異なるTUサイズに対する符号化ビットコストをどのようにして推定するかが問題である。図3の観測結果に基づき、異なるTUサイズに対する変換係数の符号化ビットコストB^coefの推定値を次式によって近似する。
ここで、α,β,θはモデル・パラメータ(フィッティング・パラメータ)であり、TUサイズN及び量子化パラメータQPに依存して変化する。図2の簡易レート推定器2では、テスト・シーケンスを用いたトレーニングにより、予めモデル・パラメータα(QP,N),β(QP,N),θ(QP,N)を学習設定しておき、実際の映像では、これらのモデル・パラメータを用いて式(10)を計算することにより、変換係数の符号化ビットコストB^coefの推定を行う。
図4は、実際の符号化ビットコストBcoefと推定符号化ビットコストB^coefとの関係を示す図である。図4から、実際の符号化ビットコストBcoefと推定符号化ビットコストB^coefとはほぼ線形関係であることが分かり、式(10)によるレート推定が比較的正確であることが実証されている。
図2の簡易レート推定器2を使用することにより、RDコスト計算のためのエントロピ符号化部107は省略される。また、式(10)による推定演算は、ルックアップテーブルを用いて演算することができるためハードウェア実装は容易にできる。また、各ブロックにおいて推定符号化ビットコストB^coefを1回だけ計算するため、計算複雑度の増加は僅かである。
(2.2)ヘッダのレート
通常、イントラ予測においては、エントロピ符号化後のヘッダービットのビット数は符号化された量子化変換係数のビット数に比べて遥かに小さい。HEVC規格書である非特許文献8によれば、イントラ予測のヘッダービットは、主として、予測モード、パーティション・サイズ、変換ユニット分割等に関する情報を含んでいる。予測モードは、隣接するブロックから予測された予測モードに基づいて符号化される。ヘッダービットのビット数の計算はさほど複雑ではないため、HEVCテストモデルで使用されている方法をそのまま使用することができる。
(2.3)全体のレート
簡易レート推定器2は、HEVCテストモデルで使用されている方法により算出されるヘッダービットのビット数Bhdrと、上述の推定符号化ビットコストB^coefとを加え(式(4)参照)、全体のレートの推定値Bmode^を算出する。
(3)低複雑度歪み推定器3
(3.1)歪みの原因
上記(1)項(式(2)参照)で説明したように、歪みはオリジナル画素と再構成画素との間のSSE(sum of square error)によって計測される。再構成画素の計算の元となるデータは、イントラ予測器102→残差画素記憶部103→変換部104→量子化部105→符号化画素記憶部106→逆量子化部109→逆変換部110→再構成部111の各モジュールを通って流れる(図1参照)。順方向変換において、N行N列(NはTUサイズ)の変換係数行列Y=(yij)は、N行N列の残差サンプル行列X=(xij)から次式によって算出される。
ここで、Cは変換行列(DCT等)、Eはスケーリング行列である。H.264/AVCやHEVCでは、変換行列Cとして、DCTをベースにして規定変換を整数のみで構成した整数変換が採用されている。整数変換は、DCTと略同等の性能を持つが、直交性を持たないため逆変換において歪みを生じる。この、変換/逆変換によって生じる歪みを変換歪みDと定義する。
一方、逆量子化部109においては、変換係数yijは、よりビット数の小さい量子化係数qijへとスケーリングされる。例えば、HEVCでは、次式の整数演算とシフト演算によって量子化が行われる。
ここで、QPは量子化パラメータ、QStepは量子化ステップ、NはTUサイズ、BitDepthは画素階調、iQBitsは量子化パラメータQP及びTUサイズに関するビットシフト数である。また、mijは重み付け量子化係数、f(QP%6)は量子化ステップによる量子化を実現するための乗算係数(スケーリング・パラメータ)であり、それぞれテーブルにより与えられる。量子化においては、右ビットシフト操作による小数部の切り捨て(床関数演算)が行われるため、量子化による歪みが生じる。この量子化歪みをDと定義する。
また、変換係数の値が所定のレンジを越えた場合には、各係数は所定の最大値にクリッピングされる。このクリッピングによって生じるクリッピング歪みをDと定義する。
従って、全体の歪みDは、D,D,Dが相互作用した結果であり、次式のように定式化される。
ここで、関数Gは相殺項も含むため、全体の歪みDはD,D,Dの単純な和とはならない。非特許文献5によれば、変換ドメイン歪み(transform domain distortion)は、実空間ドメイン歪み(actual spatial-domain distortion)Dに近似する。即ち、量子化歪みDが全体の歪みDの大部分を占める。
(3.2)ブロックレベル歪み推定
式(12a)より、量子化演算は、次式のように定式化できる。
ここで、sijはスケーリングされた変換係数である。「≫」は右ビットシフト演算子である。HEVCにおいては、デフォルトの量子化モジュール(量子化部105)は、レート歪み最適化量子化(Rate Distortion Optimized Quantization:RDOQ)である(非特許文献7)。RDOQにおいて、量子化レベルは、計算される各コストにより3つの候補量子化値の中から選択される。3つの候補量子化値とは0,lij floor,lij ceilである。ここで、lij floor,lij ceilは次式で定義される。
従って、変換係数yijから量子化歪みDを推定するのは妥当ではない。そこで、スケーリングされた変換係数sijと量子化係数qijとの差dqsijを次式により計算する。
「≪」は左ビットシフト演算子である。これにより、全体のスケーリングされた量子化歪みDqsは次式のように算出できる。
図5は、全体の歪みDとスケーリングされた量子化歪みDqsとの関係を示す図である。図5より、全体の歪みDとスケーリングされた量子化歪みDqsとは強い線形性を有することが分かる。
一方、逆量子化は、次式のように定式化される。
ここで、scaleは量子化手順におけるスケーリング・パラメータf(QP%6)と相関のあるスケーリング・パラメータ、iAddはオフセット、iShiftはTUサイズと関係するビットシフト数である。そこで、量子化歪みDの推定値D^を次式によりモデル化する。
ここで、ηはスケーリング・パラメータscaleに起因するパラメータ、kはビットシフト数iShiftに起因するパラメータ、NはTUサイズである。従って、最終的に全体の歪みDの推定値D^は次式により近似される。
ここで、μ(QP)は量子化パラメータQPに依存するモデル・パラメータ(フィッティング・パラメータ)である。テスト・シーケンスを用いた学習によって適切なμ(QP)を予め設定しておくことにより、低複雑度歪み推定器3は、式(20)を演算することによって全体の歪みDを正確に推定することができる。
低複雑度歪み推定器3を用いることにより、RDコスト計算において、図1の逆量子化部109、逆変換部110、再構成部111、再構成画素記憶部112、減算器113は省略することができる。従って、画素の再構成は、最適な予測モードに対してのみ行えばよいことになる。従って、RDコスト計算における計算複雑度は大幅に低減される。また、ハードウェア実装においては、低複雑度歪み推定器3を用いることによりデータ依存性が隠遮される。
尚、以上に説明したレート歪コスト推定装置1は、映像処理用のVLSIなどに回路的に組み込んで使用するIPコアの形態として実現することを想定して説明したが、本発明はハードウェア構成によって実現したものに限らず、プログラムとしてソフトウェア的に構成し、コンピュータに読み込ませて実行し当該コンピュータを本発明のレート歪コスト推定装置1として機能させるように構成することもできる。また、FPGA等の再構成可能論理回路用の論理回路構成情報用プログラムとして構成し、当該プログラムによって当該再構成可能論理回路を本発明のレート歪コスト推定装置1として機能させるように構成することもできる。さらには、これらのプログラムを記録媒体に記憶させた形態として提供し、又はネットワークを介して提供することもできる。
(4)実験結果
最後に、本実施例に係るレート歪コスト推定装置1により、実際の映像シーケンスを使用してレート歪コスト計算を演算する実験を行った結果について説明する。
(4.1)モデル・パラメータのトレーニング
まず、テスト・シーケンス(非特許文献10)を用いて、4つの量子化パラメータQP(=22,27,32,37)に対し、式(10)及び式(20)のモデル・パラメータα,β,θ,μを得る。式(10)のレート推定におけるモデル・パラメータα(QP,N),β(QP,N),θ(QP,N)は、最小二乗法に基づく非線形回帰アルゴリズムであるLevenberg-Marquardtアルゴリズム(非特許文献11)によってトレーニング(学習)した。また、式(20)の歪み推定におけるモデル・パラメータμ(QP)は、通常の単純な線形回帰法によって計算した。
モデル・パラメータのトレーニング(学習)には、2つのテスト・シーケンスを使用した。表2,表3に示したクラスA,Bの高解像度シーケンスにおいて、無作為に選択されたシーケンスBQTerraceによって1組のモデル・パラメータを得た。また、クラスC,D,Eの低解像度シーケンスにおいて、無作為に選択されたシーケンスBasketballPassによって1組のモデル・パラメータを得た。
(4.2)本発明のレート歪コスト推定装置1の性能
本実施例のレート歪コスト推定装置1を、JTC−VC HM−8.0(HEVC reference tool)に組み込んだ。本実験において、非特許文献10にリストアップされたすべてのテスト・シーケンスについて、量子化パラメータQPを22,27,32,37として、オール・イントラのコンフィギュレーションによりエンコードした。符号化効率及び計算複雑度を、本実施例に係るレート歪コスト推定装置1とHM−8.0とで比較した。符号化効率は、Bjonteegaard法(非特許文献12)を用いて、ビットレート差及びPSNR差により測定した。計算複雑度の減少は、次式で定義されるRDコスト計算の時間減少率ΔTRDOにより測定した。
表2に、レート歪み最適化量子化(RDOQ)を用いた場合の各テスト・シーケンスに対するRDコスト計算の実験結果を示す。この実験において、RDOQのコンフィギュレーションはオンとされている。本実施例のレート歪コスト推定装置1は、平均の画質劣化(BD-psnr)が0.107dBであるのに対し、平均のビットレート(BD-rate)が1.93%増加した。これは、許容できる範囲であり、レート歪コスト推定装置1のRDコスト推定演算が比較的正確に行われたことが実証された。そして、RDコスト計算の時間は、約34%節約された。
表3に、従来型の量子化法を用いた場合の各テスト・シーケンスに対するRDコスト計算の実験結果を示す。この実験においては、RDOQのコンフィギュレーションはオフとされている。本実施例のレート歪コスト推定装置1は、平均の画質劣化(BD-psnr)が0.109dBであるのに対し、平均のビットレート(BD-rate)が1.97%増加した。そして、RDコスト計算時間は、約44%節約された。このケースでは、表2のケースよりも多くのRDコスト計算時間を節約することができている。これは、従来型の量子化法の計算複雑度はRDOQよりも遥かに小さいためである。
本実施例のレート歪コスト推定装置1のハードウェア実装に対する寄与は、RDコスト計算時間減少率ΔTRDOに対する寄与よりも更に大きい。なぜなら、本実施例のレート歪コスト推定装置1において、パイプラインにおいて長い待ち時間を生じるエントロピ符号化及び再構成を含む、ハードウェア実装に不親和なモジュールが省略されるからである。
1 レート歪コスト推定装置
2 簡易レート推定器
3 低複雑度歪み推定器
100 レート歪コスト計算部
101 フレームメモリ
102 イントラ予測器
103 残差画素記憶部
104 変換部
105 量子化部
106 符号化画素記憶部
107 エントロピ符号化部
108 レート計算部
109 逆量子化部
110 逆変換部
111 再構成部
112 再構成画素記憶部
113 減算器
114 歪み計算部
115 レート歪計算部

Claims (3)

  1. オリジナルの入力画素ブロックの予測符号化によって得られる残差画素ブロックを変換符号化し量子化して得られた量子化変換係数からなる量子化係数画素ブロックに対し、レート歪コストを推定演算するレート歪コスト推定装置であって、
    前記量子化係数画素ブロックを記憶する符号化画素記憶手段と、
    前記符号化画素記憶手段に記憶された前記量子化係数画素ブロックをエントロピ符号化して得られる符号化画素ブロックのビットコストを、当該量子化係数画素ブロックに基づき推定演算するレート推定手段と、
    前記量子化係数画素ブロックを逆量子化及び逆変換し前記予測画像を加算することで再構成して得られる再構成画素ブロックとオリジナルの前記入力画素ブロックとの間の歪み量を、前記符号化画素記憶手段から読み出される前記量子化係数画素ブロックに基づき推定演算する歪み推定手段と、
    前記レート推定手段が算出するレート推定値に所定の定数を掛けた値と、前記歪み推定手段が算出する歪み量推定値との和であるレート歪コストを算出するレート歪コスト演算手段と、を備え、
    前記レート推定手段は、
    前記符号化画素ブロックのヘッダ部のビット数の推定値Bhdrを算出するヘッダレート演算手段と、
    前記符号化画素ブロックのヘッダ部を除く符号化係数部分のビット数の推定値Bcoefを算出する係数レート演算手段と、
    前記ヘッダレート演算手段が算出する前記推定値Bhdr及び前記係数レート演算手段が算出する前記推定値Bcoefの和であるレート推定値Bmodeを算出する全レート演算手段と、を備え、
    前記係数レート演算手段は、当該量子化係数画素ブロックの前記各量子化係数qi,jに対し、前記推定値Bcoefを次式により演算することを特徴とするレート歪コスト推定装置。
  2. 前記歪み推定手段は、
    前記残差画素ブロックを変換符号化して得られる各変換係数yi,jをスケーリングしたスケーリング変換係数si,jを算出する変換係数スケーリング手段と、
    前記スケーリング変換係数si,j,前記量子化係数qi,j,及び所定の量子化パラメータ及び画素ブロックのサイズに対して予め定められているビットシフト数iQBitsに対し、(数2)によりスケーリングされた量子化歪みの推定値Dqsを算出する量子化歪み推定手段と、
    前記量子化歪みの推定値Dqsから、(数3)により前記入力画素ブロックの全体の歪み量Dを算出する全歪み推定手段と、を備えたことを特徴とする請求項1記載のレート歪コスト推定装置。
  3. コンピュータに読み込ませて実行することにより、当該コンピュータを請求項1又は2記載のレート歪コスト推定装置として機能させることを特徴とするプログラム。
JP2013174745A 2013-08-26 2013-08-26 レート歪コスト推定装置及びプログラム Pending JP2015043524A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013174745A JP2015043524A (ja) 2013-08-26 2013-08-26 レート歪コスト推定装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013174745A JP2015043524A (ja) 2013-08-26 2013-08-26 レート歪コスト推定装置及びプログラム

Publications (1)

Publication Number Publication Date
JP2015043524A true JP2015043524A (ja) 2015-03-05

Family

ID=52696863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013174745A Pending JP2015043524A (ja) 2013-08-26 2013-08-26 レート歪コスト推定装置及びプログラム

Country Status (1)

Country Link
JP (1) JP2015043524A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111726618A (zh) * 2020-06-29 2020-09-29 上海富瀚微电子股份有限公司 Rdoq的最优量化值的计算方法
CN113382239A (zh) * 2020-02-25 2021-09-10 北京君正集成电路股份有限公司 一种适用于h265的快速残差码率代价计算方法
CN113573056A (zh) * 2021-05-25 2021-10-29 杭州博雅鸿图视频技术有限公司 一种率失真优化量化的方法、装置、存储介质及终端
CN116886913A (zh) * 2023-08-03 2023-10-13 镕铭微电子(济南)有限公司 率失真优化量化方法、装置、电子设备及存储介质

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113382239A (zh) * 2020-02-25 2021-09-10 北京君正集成电路股份有限公司 一种适用于h265的快速残差码率代价计算方法
CN111726618A (zh) * 2020-06-29 2020-09-29 上海富瀚微电子股份有限公司 Rdoq的最优量化值的计算方法
CN111726618B (zh) * 2020-06-29 2022-11-18 上海富瀚微电子股份有限公司 Rdoq的最优量化值的计算方法
CN113573056A (zh) * 2021-05-25 2021-10-29 杭州博雅鸿图视频技术有限公司 一种率失真优化量化的方法、装置、存储介质及终端
CN116886913A (zh) * 2023-08-03 2023-10-13 镕铭微电子(济南)有限公司 率失真优化量化方法、装置、电子设备及存储介质
CN116886913B (zh) * 2023-08-03 2024-03-08 镕铭微电子(济南)有限公司 率失真优化量化方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JP6454801B2 (ja) 動画像復号装置、動画像復号方法、動画像符号化装置、および動画像符号化方法
KR101187238B1 (ko) Cabac 코더의 2-패스 양자화
KR101177737B1 (ko) Cabac 코더에 대한 레이트-왜곡 모델링에 기초한 양자화
JP6284954B2 (ja) イントラ予測のためのモード決定の簡略化
JP5566529B2 (ja) 辞書を用いてビデオをコード化する方法
KR101351714B1 (ko) 비트 스트림 복호 방법
US10085028B2 (en) Method and device for reducing a computational load in high efficiency video coding
JP2017513342A (ja) ゼロアウトされた係数を使用した低複雑な順変換のためのシステムおよび方法
JP2006140758A (ja) 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
KR20100133007A (ko) 컨텍스트-적응형 가변 길이 코딩 (cavlc) 을 위한 레이트-왜곡 양자화
KR101995908B1 (ko) 영상 변환 부호화/복호화 방법 및 장치
KR20130112374A (ko) 고속 인트라 예측을 위한 영상 부호화 방법 및 장치
JPWO2009157581A1 (ja) 画像処理装置及び画像処理方法
JP2011124846A (ja) 画像符号化装置
JP6459761B2 (ja) 動画像符号化装置、動画像符号化方法及び動画像符号化用コンピュータプログラム
KR20120084168A (ko) 비디오 인코딩 모드 선택 방법 및 이를 수행하는 비디오 인코딩 장치
JP2015043524A (ja) レート歪コスト推定装置及びプログラム
CN108028938A (zh) 视频编码方法及装置
JP6402520B2 (ja) 符号化装置、方法、プログラム及び機器
JP6497100B2 (ja) 映像符号化装置、方法及びプログラム
JP6145084B2 (ja) サイズ判定方法、サイズ判定装置及びコンピュータプログラム
KR20130107414A (ko) 적응적 분할 변환을 이용한 영상의 부호화 방법
KR101730593B1 (ko) 고속 영상 부호화 방법
TW201334427A (zh) 上下文適應資料編碼