JP6392702B2 - 符号量推定方法、映像符号化装置及び符号量推定プログラム - Google Patents

符号量推定方法、映像符号化装置及び符号量推定プログラム Download PDF

Info

Publication number
JP6392702B2
JP6392702B2 JP2015097293A JP2015097293A JP6392702B2 JP 6392702 B2 JP6392702 B2 JP 6392702B2 JP 2015097293 A JP2015097293 A JP 2015097293A JP 2015097293 A JP2015097293 A JP 2015097293A JP 6392702 B2 JP6392702 B2 JP 6392702B2
Authority
JP
Japan
Prior art keywords
code amount
coefficient
transform coefficients
transform
amount estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2015097293A
Other languages
English (en)
Other versions
JP2016213735A (ja
Inventor
忍 工藤
忍 工藤
正樹 北原
正樹 北原
清水 淳
淳 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2015097293A priority Critical patent/JP6392702B2/ja
Publication of JP2016213735A publication Critical patent/JP2016213735A/ja
Application granted granted Critical
Publication of JP6392702B2 publication Critical patent/JP6392702B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Description

本発明は、映像符号化において、符号量を推定する符号量推定方法、映像符号化装置及び符号量推定プログラムに関する。
映像符号化の標準規格であるH.264/AVCやH.265/HEVC(High Efficiency Video Coding)では符号化対象ピクチャの符号化をブロック単位で行う。以下ではHEVCを例に説明する。HEVCでは符号化対象ピクチャをLCU(Largest Coding Unit)と呼ばれるブロックに分け、LCU毎に符号化を行う。LCUは四分木で最大3回まで分割することができ、最大64画素×64画素(以下、64x64と略記する)から8x8までのCU(Coding Unit)と呼ばれるブロックから構成される。
また、CU単位で異なる予測モードの符号化を行うことができ、予測モードとして符号化対象ブロックの隣接画素から予測を行うイントラ予測モード、符号化済みフレームから予測を行うインター予測モード、スキップモード、マージモードが規定されている。これらの複数のブロックサイズと予測モードの組み合わせ(以下、符号化モードと称する)の中から、符号化効率が最も高くなるように決定することが重要な課題となっている。
一般的に最適な符号化モードを決定する方法として、それぞれの符号化モードに対する評価値を算出し、評価値が最小となるように決定する方法が挙げられる。評価値の一例としては以下の式で表されるRDコストが用いられる。
RDコスト=D+λR
ここで、Dは復元信号と原信号の画素単位での差分の二乗和、Rは符号化するデータの符号量、λはラグランジアンパラメータである。
上記においてRの算出には可変長符号化処理を実行する必要があるため、演算コストが高い。Rをオーバーヘッド符号量と変換係数符号量に分けた場合に、特に変換係数符号量はオーバーヘッド符号量と比較して符号化シンボル数が多い傾向があるため、可変長符号化処理に要する演算コストの割合も高くなる。もし変換係数符号量の算出を精度良く且つ、演算量の少ない計算で推定することができれば、最適な符号化モード決定に要する演算量を大幅に減少させることができる。
このような課題に対して、以下のような方法が提案されている(例えば、非特許文献1参照)。非特許文献1では以下の式から変換係数符号量RCOEFFを推定する。
COEFF=α・Nnz+β・EQTC
ここで、Nnzは非零係数の個数、EQTCは量子化後係数のL1ノルム(絶対値和)、α及びβは重み付け係数をそれぞれ表す。可変長符号化では非零係数のみ正負符号やレベル値を符号化し、更にレベル値はその大きさに準じて符号量が増加するという性質があるため、このようなパラメータを用いて近似することで符号量の推定を実現している。
なお、本明細書において、画像とは、静止画像、または動画像を構成する1フレーム分の画像のことをいう。また映像とは、動画像と同じ意味であり、一連の画像の集合である。
Y. K. Tu, J. F. Yang, M. T. Sun, "Rate-Distortion Modeling for Efficient H.264/AVC Encoding," IEEE Trans. CSVT, Vol. 17, No. 5, May 2007.
しかしながら、非特許文献1に記載の技術(従来技術と称する)にあっては、符号量の推定精度が十分でないという問題がある。特に対象ブロックサイズが大きい場合においては上記で近似されていない有意係数フラグ等の符号化パラメータによる推定誤差が大きくなってしまうという問題がある。
本発明は、このような事情に鑑みてなされたもので、従来技術と同等の演算量で且つ高い精度で変換係数の符号量推定を行うことができる符号量推定方法、映像符号化装置及び符号量推定プログラムを提供することを目的とする。
本発明の一態様は、画像領域を分割した符号化対象ブロックの符号量を推定する映像符号化装置が行う符号量推定方法であって、変換係数をグループに分類する変換係数分類ステップと、分類された前記グループについて、絶対値が予め決められた閾値よりも大きい第1の変換係数の数を算出する第1の係数個数算出ステップと、前記符号化対象ブロックの変換係数の符号量を前記第1の係数個数算出ステップにおいて算出した第1の変換係数の数を用いて推定する符号量推定ステップとを有する符号量推定方法である。
本発明の一態様は、前記符号量推定方法であって、分類された前記グループについて、スキャン順で最終係数位置までの絶対値が予め決められた閾値以下である第2の変換係数の数を算出する第2の係数個数算出ステップをさらに有し、前記符号量推定ステップでは、前記第1の変換係数の数と前記第2の変換係数の数を用いて前記符号化対象ブロックの変換係数の符号量を推定する。
本発明の一態様は、前記符号量推定方法であって、前記変換係数分類ステップでの分類を符号化対象ブロックの特徴量に基づいて決定する。
本発明の一態様は、前記符号量推定方法であって、分類された前記グループについて、前記第1の変換係数の数と前記第2の変換係数の数から発生確率を算出し、前記発生確率に基づいて前記変換係数をグループに再分類する変換係数再分類ステップと、再分類された前記グループについて前記第1の変換係数の数と前記第2の変換係数の数を再度算出する係数個数再算出ステップとをさらに有する。
本発明の一態様は、前記符号量推定方法であって、前記符号量推定ステップで用いる重み付け係数を前記符号化対象ブロックの特徴量に基づいて決定する重み付け係数算出ステップをさらに有し、前記符号量推定ステップでは、前記符号化対象ブロックの変換係数の符号量を前記重み付け係数と前記第1の変換係数の数と前記第2の変換係数の数を用いて推定する。
本発明の一態様は、前記符号量推定方法であって、前記重みづけ係数は、分類された前記グループについて、前記第1の変換係数の数と前記第2の変換係数の数から算出される発生確率に基づいて決定する。
本発明の一態様は、画像領域を分割した符号化対象ブロックの符号量を推定する映像符号化装置であって、変換係数をグループに分類する変換係数分類手段と、分類された前記グループについて、絶対値が予め決められた閾値よりも大きい第1の変換係数の数を算出する第1の係数個数算出手段と、前記符号化対象ブロックの変換係数の符号量を前記第1の係数個数算出手段において算出した第1の変換係数の数を用いて推定する符号量推定手段とを備える映像符号化装置である。
本発明の一態様は、前記符号量推定方法をコンピュータに実行させるための符号量推定プログラムである。
本発明によれば、従来技術と同等の演算量で且つ高い精度で変換係数の符号量推定を行うことができるため、符号化効率の低下を抑えつつ最適な符号化モード決定に要する演算量削減を実現することができるという効果が得られる。
本発明の第1実施形態による映像符号化装置の構成を示すブロック図である。 図1に示す符号化モード決定部15の構成を示すブロック図である。 図2に示す符号量推定部152の構成を示すブロック図である。 図3に示す符号量推定部152の処理動作を示すフローチャートである。 図4に示す処理動作を示す図である。 斜め方向、垂直方向、水平方向の3つのスキャン順を示す図である。 第2実施形態における符号量推定部152の処理動作を示すフローチャートである。 有意係数フラグのコンテキスト番号によって3つのグループに分類した例を示す図である。 有意係数フラグのコンテキスト番号によって3つのグループに分類した例を示す図である。 変形例1で説明した有意係数フラグのコンテキスト番号を各サブブロックにおける平均によって8つのグループに分類した例を示す図である。 シーケンスサイズによる分類例を示す図である。 予測モードによる分類例を示す図である。 第3実施形態における符号量推定部152の構成を示すブロック図である。 図13に示す符号量推定部152の処理動作を示すフローチャートである。 第4実施形態における符号量推定部152の構成を示すブロック図である。 図15に示す符号量推定部152の処理動作を示すフローチャートである。
<第1実施形態>
以下、図面を参照して、本発明の第1実施形態による映像符号化装置を説明する。図1は同実施形態の構成を示すブロック図である。以下では一例としてHEVCに準拠した映像符号化装置に本発明を適用した場合の実施形態を示す。ここではLCUサイズは64x64、CUサイズは64x64〜8x8の4階層を用いた場合について説明する。
映像符号化装置1には符号化対象入力映像の各符号化対象ピクチャについてLCUブロック単位で入力し、このブロックに対応した符号化データを出力する。これが符号化対象ピクチャの各ブロックについてラスタスキャン順に繰り返し実行されることで、符号化対象ピクチャが符号化されることになる。
直交変換部12には、映像符号化装置1に入力された入力映像とイントラ予測部19またはインター予測部21から出力される予測画像との差分が減算器11により入力され、直交変換を行う。量子化部13は、直交変換部12の出力を量子化し、可変長符号化部14と逆量子化/逆直交変換部16へ出力する。
可変長符号化部14は量子化部13から出力された量子化係数を可変長符号化し、符号化データとして映像符号化装置1から出力する。逆量子化/逆直交変換部16は量子化部13から出力された量子化係数に対して逆量子化と逆直交変換を施して出力する。
加算部17は、逆量子化/逆直交変換部16から出力された画像と、イントラ予測部19またはインター予測部21から出力される予測画像との和を求めて出力する。ループフィルタ部18は加算部17によって求めた和に対してループフィルタを適用する。
復号ピクチャメモリはループフィルタ部18の出力を格納する。復号ピクチャメモリ20に格納された参照画像は、インター予測部21に入力し、後の符号化対象ブロックのインター予測において参照画像として利用される。
イントラ予測部19は、加算部17が出力する和を参照画像として符号化対象ブロックのイントラ予測画像を生成する。インター予測部21は復号ピクチャメモリ20の参照画像を用いて符号化対象ブロックのインター予測画像を生成する。
符号化モード決定部15は対象ブロックに関する符号化モードを決定する。符号化モードの一例としては、LCU内のCUブロックサイズ構成、各CUの予測モードが挙げられる。イントラ/インター切替スイッチ22は符号化モード決定部15からの出力に応じてイントラ予測部19の出力と、インター予測部21の出力とを切り替えて出力する。
次に、図2を参照して、図1に示す符号化モード決定部15の構成を説明する。図2は、図1に示す符号化モード決定部15の構成を示すブロック図である。誤差算出部151は、対象符号化モードの誤差を算出する。符号量推定部152は対象符号化モードの符号量を推定する。符号化コスト算出部153は誤差算出部151が算出した誤差と、符号量推定部152が推定した符号量とから符号化コストを算出する。
符号化コスト比較部154は算出した符号化コストを比較し、比較した結果から対象ブロックの最適な符号化モードを決定する。誤差算出部151で算出する誤差Dは一例としてここでは以下の式から算出する。
D=EΣuvq(u,v)
ここで、Eは直交変換のスケーリングパラメータ、qはブロック座標(u,v)の変換係数における量子化誤差である。
符号化コスト算出部153で算出する符号化コストは一例としてここでは以下のように算出する。
符号化コスト=D+λ(Rcoeff+Roh
ここで、Rcoeffは符号量推定部152から出力される変換係数の符号量、Rohは対象ブロックのオーバーヘッド符号量、λはラグランジアンパラメータである。
次に、図3を参照して、図2に示す符号量推定部152の構成を説明する。図3は、図2に示す符号量推定部152の構成を示すブロック図である。変換係数分類部1521は変換係数をK個のグループへ分類する。第1係数カウント部1522はグループ毎に量子化パラメータによって絶対値が予め決められた閾値θより大きい変換係数である第1の変換係数の個数をカウントする。第2係数カウント部1523はグループ毎にスキャン順で最終係数位置までの絶対値が閾値θ以下の変換係数である第2の変換係数の個数をカウントする。符号量算出部1524は、第1係数と第2係数の数より符号量を算出する。
次に、図4を参照して、図3に示す符号量推定部152の処理動作を説明する。図4は、図3に示す符号量推定部152の処理動作を示すフローチャートである。まず、変換係数分類部1521は変換係数をK個のグループへ分類する(ステップS1)。ここでは一例として座標位置に応じて分類するものとする。
次に、第1係数カウント部1522はグループ毎に量子化パラメータによって絶対値が予め決められた閾値θより大きい変換係数である第1の変換係数の個数をカウントする(ステップS2)。これと並行して、第2係数カウント部1523はグループ毎にスキャン順で最終係数位置までの絶対値が閾値θ以下の変換係数である第2の変換係数の個数をカウントする(ステップS3)。
ただし、変換係数を4x4サイズ毎のサブブロックに分けた時にサブブロック内の全変換係数が閾値θ以下であるサブブロックについてはカウントしない。なお、本実施形態では、LCUサイズは64x64、CUサイズは64x64〜8x8の4階層を用いた場合について説明しているが、LCUサイズが64x64、CUサイズも64x64のみの場合も同様になる。どの変換サイズでも必ず4x4のサブブロックに分かれ、符号化され、この時、HEVCでは4x4の中が全て閾値以下だと符号化が省略されるためである。
この処理動作を図5に示す例に適用すると、ケース1の場合は、全グループ合計で第1係数は10個、第2係数は18個となり、ケース2の場合は、第1係数は5個、第2係数は14個となる。図5は、図4に示す処理動作を示す図である。
次に、符号量算出部1524は以下の式(1)から対象ブロックの変換係数符号量Rcoeffを算出する(ステップS4)。
coeff=Σk=1 (N1,k+b2,k) ・・・(1)
ここで、a、b、N1,k及びN2,kはそれぞれk番目のグループに対応する第1の変換係数の重み付け係数、第2の変換係数の重み付け係数、第1の変換係数の個数及び第2の変換係数の個数である。aとbは予め決められた値を用いてもよいし、符号化処理の途中で適応的に切り替えてもよい。
なお、前述した説明においては、第1の変換係数の数と第2の変換係数の数とに基づいて符号量を推定する例を説明したが、必ずしも第1、第2の変換係数の数から符号量を求める必要はなく、第1の変換係数の数のみから符号量の推定を行ってもよい。
このように、第1実施形態では、変換係数を1つ以上のグループに分類し、分類されたそれぞれのグループで絶対値が予め決められた閾値よりも大きい第1の変換係数の数とスキャン順で最終係数位置までの絶対値が予め決められた閾値以下である第2の変換係数の数をカウントする。そして、対象ブロックの変換係数の符号量を前記第1の変換係数の数と第2の変換係数の数を用いて符号量を推定する。第1実施形態の特徴は、対象ブロック内を1つ以上のグループに分類する点と、それぞれのグループ内で絶対値が閾値よりも大きい係数の数(非零係数の数)だけでなくスキャン順で最終係数位置までの絶対値が閾値以下の係数の数(零係数の数)をカウントする点である。
一般的に変換係数の符号化を行う際に、同じ変換係数の値を符号化する場合でも、符号化時点での符号化シンボルのコンテキストや発生確率によって生じる符号量が異なる。すなわち、本実施形態のように変換係数を2つ以上のグループに分類し、それぞれのグループ毎にカウントすることで、異なる発生確率を考慮した推定が行えるため精度向上が見込める。また、変換係数の符号化は予め決められたスキャン順で行われる。図6は、斜め方向、垂直方向、水平方向の3つのスキャン順を示す図である。例えばHEVCでは斜め方向、垂直方向、水平方向の3つのスキャン順が用意されており(図6参照)、イントラモードの場合はイントラ予測方向によって3つの中から選択され、それ以外のモードは斜め方向が用いられる。従来はスキャン順が考慮されていないため、推定される符号量はスキャン順に関わらず同じ値が推定されてしまうが、スキャン順で最終係数位置までの零係数の数もカウントすることでスキャン順が考慮され、更に推定精度を向上させることができる。
<第2実施形態>
次に、本発明の第2実施形態による映像符号化装置を説明する。第2実施形態における映像符号化装置の構成は、図1に示す構成と同等の構成であるため、ここでは詳細な説明を省略する。また、第2実施形態における符号量推定部152の構成についても図3に示す構成と同等であるため、ここでは詳細な説明を省略する。第2実施形態が第1実施形態と異なる点は、図4に示す処理動作が図7に示す処理動作とした点である。第1実施形態では座標位置に応じて分類したが、グループ毎の発生確率が同じになるように分類することで更なる精度向上が見込める。
図7は第2実施形態における符号量推定部152の処理動作を示すフローチャートである。図4に示す処理動作との違いは変換係数の分類方法が対象ブロックのコンテキスト情報等に基づく特徴量に基づいて分類する(ステップS5)点である。ステップS2〜S4は、図4に示す処理動作と同等である。以下ではコンテキスト情報等に基づいて分類する例についていくつかの変形例を説明する。なお、ここでは変換サイズが16x16の場合について説明するが、それ以外の変換サイズでも同様に適用することができる。
(変形例1):コンテキスト番号による分類
コンテキストに対する符号化シンボルの発生確率が変動しない場合には、コンテキスト番号が発生確率の違いを表すことになるため、コンテキスト番号によって分類することで高い精度で推定を行うことができるようになる。図8及び図9は、一例として有意係数フラグのコンテキスト番号によって3つのグループに分類した例を示す図である。なお、その他のコンテキストを用いてもよく、それらを複数組み合わせて分類してもよい。
この例では、HEVCにおける有意係数フラグのコンテキスト番号選択では、まず次式で定義されるpatternを算出する。
Pattern=(condB×2+condR)
ここで、CondB、CondRはそれぞれ対象サブブロックCの右隣接サブブロックR、下隣接サブブロックBについてのサブブロックフラグの値を示す。サブブロックフラグはサブブロック内の全ての変換係数が閾値θ以下である場合には0、それ以外の場合は1となる。
この対象サブブロックCのpattern値によって、各変換係数の有意係数フラグのコンテキスト番号を以下のように決定する(図9参照)。Pattern=0の場合、左上の係数が2番、左上に近い5つの係数が1番、それ以外の係数が0番となる。Pattern=1の場合、上から1行目の係数が2番、2行目の係数が1番、それ以外が0番となる。Pattern=2の場合、左から1列目の係数が2番、2列目の係数が1番、それ以外が0番となる。Pattern=3の場合、全ての係数が2番となる。そして、各変換係数のグループ番号は有意係数フラグに1を加えたものとして求める。
(変形例2):サブブロック位置とコンテキスト番号の平均による分類
変形例1ではコンテキスト番号の選択処理を行う必要があるため演算量が増加してしまう可能性がある。そこでサブブロックの位置とそのサブブロック位置が取りうるコンテキスト番号の平均で分類する。このようにすることでコンテキスト番号の選択処理を省略できるため、高速化が期待できる。図10は、一例として変形例1で説明した有意係数フラグのコンテキスト番号を各サブブロックにおける平均によって8つのグループに分類した例を示す図である。なお、ここでは8グループに分類しているが、発生確率が近いグループを同じグループにしてもよく、例えばグループ(1)から(4)までを1つのグループ、グループ(5)から(8)までを1つのグループとし、計2グループで分類してもよい。
この例では、図10に示すサブブロックの位置によってA,B,Cの3パターンの中から選択される。パターンAは対象ブロックの右端及び下端以外に位置するサブブロックに適用され、図9に示すのpattern4つ全ての各変換係数についての平均を算出し、値が同じ領域を同一グループに分類した場合を表す。パターンBは対象ブロックの右端(下端を除く)に位置するサブブロックに適用され、図9に示すpattern0とpattern2の各変換係数についての平均を算出し、値が同じ領域を同一グループに分類した場合を表す。同様にパターンCは対象ブロックの下端に位置するサブブロックに適用され、図9に示すpattern0とpattern1の各変換係数についての平均を算出し、値が同じ領域を同一グループに分類した場合を表す。
(変形例3):その他のバリエーション(コンテキスト情報以外)
その他の特徴量としてシーケンスサイズや予測モードなどが適用できる。変形例2に組み合わせた場合を一例として、それぞれ以下に説明する。まず、シーケンスサイズを適用する場合について説明する。シーケンスサイズが大きい場合には小さい場合と比較して高周波数成分の有意係数の出現確率が小さくなると予想されるので、図11に示すように高周波数成分のグループ範囲を大きくし、シーケンスサイズが小さい場合にはその逆で低周波数成分のグループ範囲が少なくなるように分類する。図11は、シーケンスサイズによる分類例を示す図である。こうすることによって、シーケンスサイズによる符号化シンボルの出現確率の変動を考慮することが出来るため、適切な分類が可能になる。
次に、予測モードを適用する場合について説明する。予測モードがインターモードの場合には高周波数成分の有意係数の出現確率が小さくなると予想されるので、図12に示すように高周波数成分のグループ範囲を大きくし、イントラモードの場合は低周波数成分のグループ範囲が小さくなるようにし、マージモードの場合はその中間になるように分類する。図12は、予測モードによる分類例を示す図である。こうすることで、上記同様に異なるモードでの符号化シンボルの出現確率の変動を考慮することができ、適切な分類が可能になる。
このように、第2実施形態では、変換係数の分類を対象ブロックのコンテキスト情報に基づく1つ以上の特徴量に基づいて行うようにした。変換係数の発生符号量は符号化するパラメータの発生確率に依存する。そして、コンテキストの違いは発生確率の違いを表しているため、コンテキスト情報に基づく特徴量を用いて変換係数を分類することで適切な分類が期待できる。例えば有意係数フラグのコンテキスト番号は重み付け係数との相関が高いため、より正確な分類が可能となる。なお、有意係数フラグとは、スキャン順で最終係数までの変換係数が0であるか否かを示すフラグのことである。
<第3実施形態>
次に、本発明の第3実施形態による映像符号化装置を説明する。第3実施形態における映像符号化装置の構成は、図1に示す構成と同等の構成であるため、ここでは詳細な説明を省略する。第1及び第2実施形態ではコンテキストに対する符号化シンボルの発生確率が変動しない場合には有効であるが、符号化処理の過程で発生確率が変動する場合には推定誤差が生じる可能性がある。そこで、対象ブロックの各グループにおける第1の変換係数の数と第2の変換係数の数に応じてグループを再分類(グループ番号の再割り当て)することで、この問題を解決する。
第3実施形態が第1実施形態と異なる点は、符号量推定部152の構成が異なる点である。図13は、第3実施形態における符号量推定部152の構成を示すブロック図である。図13に示す符号量推定部152は、第1及び第2実施形態と異なり符号量推定部152に新たに変換係数再分類部1525と第1・第2係数再算出部1526が追加されている。
変換係数再分類部1525は第1の変換係数の数と第2の変換係数の数から計算される発生確率に基づいて変換係数の再分類を行う。第1・第2係数再算出部1526では再分類されたグループについて第1の変換係数の数及び第2の変換係数の数を再算出する。
以下に一例として、第2実施形態で説明した変形例1をこの考え方に基づいて変更した場合を説明する。まず、各グループで算出した第1の変換係数の数と第2の変換係数の数から以下のように発生確率mを算出する。kはグループ番号を表すインデックスである。
=グループkの第1の変換係数の数/(グループkの第1の変換係数の数+グループkの第2の変換係数の数)
発生確率と対応する再分類用のグループ番号のテーブルを用意しておき、算出した発生確率に最も近いグループ番号を新たに再割り当てする。再分類結果の例として、例えばあるブロックでは図8に示すコンテキスト番号の2と1が示す領域の発生確率が近い値になった場合はそれらの領域を同じグループとして再分類する。また、一方では、あるブロックでは図8に示すコンテキスト番号の1と0が示す領域の発生確率が近い値になった場合はそれらの領域を同じグループとして再分類することになり、より発生確率が近い領域同士が同じグループとして分類することが可能となる。そして、再分類されたグループについて第1の変換係数の数と第2の変換係数の数の合計を再算出し、それらの値を用いて符号量を推定する。
次に、図14を参照して、図13に示す符号量推定部152の処理動作を説明する。図14は、図13に示す符号量推定部152の処理動作を示すフローチャートである。まず、変換係数分類部1521は、変換係数を対象ブロックの特徴量に応じたグループに分類する(ステップS5)。続いて、第1係数カウント部1522は、各グループにおいて絶対値が閾値より大きい第1の変換係数の数をカウントする(ステップS2)。これと並行して、第2係数カウント部1523は、各グループにおいてスキャン順で最終係数位置までの絶対値が閾値以下である第2の変換係数の数をカウントする(ステップS3)。
次に、変換係数再分類部1525は、各グループで発生確率を算出し、発生確率が近いグループを新たにグループとして再分類する(ステップS6)。続いて、第1・第2係数再算出部1526は、再分類されたグループについて第1の変換係数の数と第2の変換係数の数を算出する(ステップS7)。そして、符号量算出部1524は、第1の変換係数の数と第2の変換係数の数から符号量を推定する(ステップS4)。
このように、第3実施形態では、分類された各グループについて、第1の変換係数の数と前記第2の変換係数の数から発生確率を算出し、変換係数を発生確率に基づいて1つ以上のグループに再分類する。そして、再分類された各グループについて前記第1の変換係数の数と前記第2の変換係数の数を再算出し、符号量を推定する。
符号化処理の過程で符号化シンボルの発生確率が変動するような場合に対応するため、対象ブロックの中で発生確率を計算し、その結果に応じてグループを再分類することで前述の問題に対応することができる。
<第4実施形態>
次に、本発明の第4実施形態による映像符号化装置を説明する。第4実施形態における映像符号化装置の構成は、図1に示す構成と同等の構成であるため、ここでは詳細な説明を省略する。第4実施形態では分類した際の各グループの発生確率に相当する部分を適応的に変える、すなわち、式(1)で用いる重み付け係数を符号化処理の過程で適応的に決定する場合について説明する。このように重み付け係数を適応的に決定することで、ブロック毎に符号化シンボルの発生確率に応じた適切な符号量推定を行うことができる。
図15は、第4実施形態における符号量推定部152の構成を示すブロック図である。第2実施形態との違いは第1の係数の数と第2の係数の数から符号量を推定する前に重み付け係数算出部1527によって対象ブロックの特徴量に応じて重み付け係数を決定している点が異なる。なお、第1及び第3実施形態に対しても同じように重み付け決定処理を加えて対応させることもできる。以下に一例として各グループで算出した第1の変換係数の数と第2の変換係数の数から計算される発生確率を用いて重み付け係数を決定する例を示す。その他、対象ブロックの変換サイズや量子化パラメータ、ピクチャサイズなどに応じて重み付け係数を切り替えるようにしてもよい。
まず、重み付け係数算出部1527は、各グループで算出した第1の変換係数の数と第2の変換係数の数から発生確率mを算出する。そして、その値に線形するように重み付け係数a、bをそれぞれ算出する。例えば1次関数を用いる場合は以下のように算出される。
=s・m+t
=s・(1−m)+t
ここで、s、s、t、tはそれぞれ任意の定数である。そして、式(1)を用いて符号量推定を行う際にこれらの値を用いて算出する。
次に、図16を参照して、図15に示す符号量推定部152の処理動作を説明する。図16は、図15に示す符号量推定部152の処理動作を示すフローチャートである。まず、変換係数分類部1521は、変換係数を対象ブロックの特徴量に応じたグループに分類する(ステップS5)。続いて、第1係数カウント部1522は、各グループにおいて絶対値が閾値より大きい第1の変換係数の数をカウントする(ステップS2)。これと並行して、第2係数カウント部1523は、各グループにおいてスキャン順で最終係数位置までの絶対値が閾値以下である第2の変換係数の数をカウントする(ステップS3)。
次に、重み付け係数算出部1527は、対象ブロックの特徴量に応じて重み付け係数を決定する(ステップS8)。そして、符号量算出部1524は、第1の変換係数の数と第2の変換係数の数から符号量を推定する(ステップS4)。
このように、第4実施形態では、符号量推定ステップで用いる重み付け係数を対象ブロックの1つ以上の特徴量に基づいて決定する。
符号化処理の過程で符号化シンボルの発生確率が変動するような場合に対応するために、グループを適切に分類するだけでなく重み付け係数を適応的に決定することで、更に正確な符号量推定を実現することができる。
以上説明したように、映像符号化における変換係数の符号量を推定する際に、変換係数を符号化対象ブロックのコンテキスト情報に基づいてグループに分類し、それぞれのグループ毎に変換係数をカウントすることにより、符号量の推定精度向上が可能になる。
前述した実施形態における映像符号化装置の全部または一部をコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよく、PLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されるものであってもよい。
以上、図面を参照して本発明の実施の形態を説明してきたが、上記実施の形態は本発明の例示に過ぎず、本発明が上記実施の形態に限定されるものではないことは明らかである。したがって、本発明の技術思想及び範囲を逸脱しない範囲で構成要素の追加、省略、置換、その他の変更を行ってもよい。
従来技術と同等の演算量で且つ高い精度で変換係数の符号量推定を行うことが不可欠な用途に適用できる。
1・・・映像符号化装置、11・・・減算部、12・・・直交変換部、13・・・量子化部、14・・・可変長符号化部、15・・・符号化モード決定部、16・・・逆量子化/逆直交変換部、17・・・加算部、18・・・ループフィルタ部、19・・・イントラ予測部、20・・・復号ピクチャメモリ、21・・・インター予測部、22・・・イントラ/インター切替スイッチ、151・・・誤差算出部、152・・・符号量推定部、153・・・符号化コスト算出部、154・・・符号化コスト比較部、1521・・・変換係数分類部、1522・・・第1係数カウント部、1523・・・第2係数カウント部、1524・・・符号量算出部、1525・・・変換係数再分類部、1526・・・第1・第2係数再算出部、1527・・・重み付け係数算出部

Claims (9)

  1. 画像領域を分割した符号化対象ブロックの符号量を推定する映像符号化装置が行う符号量推定方法であって、
    変換係数をグループに分類する変換係数分類ステップと、
    分類された前記グループについて、絶対値が予め決められた閾値よりも大きい第1の変換係数の数を算出する第1の係数個数算出ステップと、
    前記符号化対象ブロックの変換係数の符号量を前記第1の係数個数算出ステップにおいて算出した第1の変換係数の数を用いて推定する符号量推定ステップと
    分類された前記グループについて、スキャン順で最終係数位置までの絶対値が予め決められた閾値以下である第2の変換係数の数を算出する第2の係数個数算出ステップと、
    を有し、
    前記符号量推定ステップでは、前記第1の変換係数の数と前記第2の変換係数の数を用いて前記符号化対象ブロックの変換係数の符号量を推定する、
    符号量推定方法。
  2. 画像領域を分割した符号化対象ブロックの符号量を推定する映像符号化装置が行う符号量推定方法であって、
    変換係数をグループに分類する変換係数分類ステップと、
    分類された前記グループについて、絶対値が予め決められた閾値よりも大きい第1の変換係数の数を算出する第1の係数個数算出ステップと、
    前記符号化対象ブロックの変換係数の符号量を前記第1の係数個数算出ステップにおいて算出した第1の変換係数の数を用いて推定する符号量推定ステップと
    を有し、
    前記変換係数分類ステップでの分類を符号化対象ブロックの特徴量に基づいて決定する符号量推定方法。
  3. 分類された前記グループについて、前記第1の変換係数の数と前記第2の変換係数の数から発生確率を算出し、前記発生確率に基づいて前記変換係数をグループに再分類する変換係数再分類ステップと、
    再分類された前記グループについて前記第1の変換係数の数と前記第2の変換係数の数を再度算出する係数個数再算出ステップと
    をさらに有する請求項に記載の符号量推定方法。
  4. 前記符号量推定ステップで用いる重み付け係数を前記符号化対象ブロックの特徴量に基づいて決定する重み付け係数算出ステップをさらに有し、
    前記符号量推定ステップでは、前記符号化対象ブロックの変換係数の符号量を前記重み付け係数と前記第1の変換係数の数と前記第2の変換係数の数を用いて推定する請求項1または3に記載の符号量推定方法。
  5. 前記重みづけ係数は、分類された前記グループについて、前記第1の変換係数の数と前記第2の変換係数の数から算出される発生確率に基づいて決定する請求項に記載の符号量推定方法。
  6. 画像領域を分割した符号化対象ブロックの符号量を推定する映像符号化装置が行う符号量推定方法であって、
    座標位置に応じて変換係数をグループに分類する変換係数分類ステップと、
    分類された前記グループについて、絶対値が予め決められた閾値よりも大きい第1の変換係数の数を算出する第1の係数個数算出ステップと、
    前記符号化対象ブロックの変換係数の符号量を前記第1の係数個数算出ステップにおいて算出した第1の変換係数の数を用いて推定する符号量推定ステップと
    を有する符号量推定方法。
  7. 前記符号量推定ステップでは、分類された前記グループごとに重みづけを行う、
    請求項6に記載の符号量推定方法。
  8. 画像領域を分割した符号化対象ブロックの符号量を推定する映像符号化装置であって、
    変換係数をグループに分類する変換係数分類手段と、
    分類された前記グループについて、絶対値が予め決められた閾値よりも大きい第1の変換係数の数を算出する第1の係数個数算出手段と、
    前記符号化対象ブロックの変換係数の符号量を前記第1の係数個数算出手段において算出した第1の変換係数の数を用いて推定する符号量推定手段と
    分類された前記グループについて、スキャン順で最終係数位置までの絶対値が予め決められた閾値以下である第2の変換係数の数を算出する第2の係数個数算出手段と、
    を備え、
    前記符号量推定手段は、前記第1の変換係数の数と前記第2の変換係数の数を用いて前記符号化対象ブロックの変換係数の符号量を推定する、
    映像符号化装置。
  9. 請求項1からのいずれか1項に記載の符号量推定方法をコンピュータに実行させるための符号量推定プログラム。
JP2015097293A 2015-05-12 2015-05-12 符号量推定方法、映像符号化装置及び符号量推定プログラム Active JP6392702B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2015097293A JP6392702B2 (ja) 2015-05-12 2015-05-12 符号量推定方法、映像符号化装置及び符号量推定プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2015097293A JP6392702B2 (ja) 2015-05-12 2015-05-12 符号量推定方法、映像符号化装置及び符号量推定プログラム

Publications (2)

Publication Number Publication Date
JP2016213735A JP2016213735A (ja) 2016-12-15
JP6392702B2 true JP6392702B2 (ja) 2018-09-19

Family

ID=57551921

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015097293A Active JP6392702B2 (ja) 2015-05-12 2015-05-12 符号量推定方法、映像符号化装置及び符号量推定プログラム

Country Status (1)

Country Link
JP (1) JP6392702B2 (ja)

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000013794A (ja) * 1998-06-23 2000-01-14 Mitsubishi Electric Corp 動画像符号化装置、動画像符号化方法、動画像復号装置、および動画像復号方法
JP2006140758A (ja) * 2004-11-12 2006-06-01 Toshiba Corp 動画像符号化方法、動画像符号化装置および動画像符号化プログラム
JP4771288B2 (ja) * 2006-04-03 2011-09-14 富士ゼロックス株式会社 データ処理装置及びプログラム
JP2010087771A (ja) * 2008-09-30 2010-04-15 Nec Electronics Corp 画像符号化装置及び方法
JP2010130522A (ja) * 2008-11-28 2010-06-10 Canon Inc 動画像符号化装置及び動画像符号化方法

Also Published As

Publication number Publication date
JP2016213735A (ja) 2016-12-15

Similar Documents

Publication Publication Date Title
CN110024392B (zh) 用于视频译码的低复杂度符号预测
CN109314789B (zh) 用于基于帧内预测的视频信号处理的方法及装置
CN108781285B (zh) 基于帧内预测的视频信号处理方法及装置
KR101978194B1 (ko) 디지털 이미지를 처리하는 방법 및 시스템
US10003792B2 (en) Video encoder for images
JP5490404B2 (ja) 画像復号装置
WO2014054267A1 (ja) 画像符号化装置及び画像符号化方法
JP2022509024A (ja) ビデオ信号の符号化/復号方法及び前記方法のための装置
JP2014523186A (ja) エントロピー符号化/復号化方法及びその装置
CN111316642B (zh) 信令图像编码和解码划分信息的方法和装置
JP2015027022A (ja) 動画像符号化装置、動画像符号化方法、およびプログラム
KR102605285B1 (ko) 다중 그래프 기반 모델에 따라 최적화된 변환을 이용하여 비디오 신호를 인코딩/디코딩하는 방법 및 장치
JP5702820B2 (ja) 予測モード決定方法、動画像符号化装置、及び予測モード決定プログラム
JP2017228827A (ja) イントラ予測器、画像符号化装置、画像復号装置およびプログラム
JP6392702B2 (ja) 符号量推定方法、映像符号化装置及び符号量推定プログラム
JP6188344B2 (ja) 走査順生成装置、動画像符号化装置、動画像復号装置、走査順生成方法、およびプログラム
CN115834882A (zh) 一种帧内预测方法、装置、电子设备及存储介质
JP6171584B2 (ja) 動画像符号化装置、動画像符号化方法、および動画像符号化プログラム
WO2015046431A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、およびプログラム
JP7147145B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
WO2019150435A1 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
JP6080077B2 (ja) 画像符号化方法及び画像符号化装置
JP2015015595A (ja) 動画像符号化装置、符号化モード判定方法及び符号化プログラム
JP7548418B2 (ja) 映像符号化装置、映像符号化方法、映像符号化プログラム、及び非一時的記録媒体
WO2024055155A1 (zh) 一种编解码方法、装置、编码器、解码器及存储介质

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170626

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180601

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180612

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180810

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180821

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180823

R150 Certificate of patent or registration of utility model

Ref document number: 6392702

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150