JP2013201467A - 動画像符号化装置および動画像復号装置および符号化データ構造 - Google Patents

動画像符号化装置および動画像復号装置および符号化データ構造 Download PDF

Info

Publication number
JP2013201467A
JP2013201467A JP2010160730A JP2010160730A JP2013201467A JP 2013201467 A JP2013201467 A JP 2013201467A JP 2010160730 A JP2010160730 A JP 2010160730A JP 2010160730 A JP2010160730 A JP 2010160730A JP 2013201467 A JP2013201467 A JP 2013201467A
Authority
JP
Japan
Prior art keywords
filter
image
coefficient
unit
filter coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2010160730A
Other languages
English (en)
Inventor
Tomohiro Igai
知宏 猪飼
Yoshihiro Kitaura
嘉浩 北浦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP2010160730A priority Critical patent/JP2013201467A/ja
Priority to PCT/JP2011/066020 priority patent/WO2012008506A1/ja
Publication of JP2013201467A publication Critical patent/JP2013201467A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】
複数種類の入力信号を用いる適応フィルタを備える動画像復号装置において、適応フィルタに用いる入力信号の種別によって適応的にフィルタ係数を予測符号化する。
【解決手段】
符号化データからフィルタ係数の可変長符号の復号を行う可変長符号復号部と、復号済みのフィルタ係数を用いて、復号対象のフィルタ係数の予測値を算出するフィルタ係数予測部とを備える動画像復号装置であって、さらに、前記フィルタ係数予測部は、フィルタ係数毎に定まる寄与率とフィルタ係数との積和によって算出される重み係数和を算出する重み係数和算出手段を備える。
【選択図】図4

Description

動画像符号化装置および動画像復号装置および符号化データ構造に関する。
動画像符号化技術の分野では、一般に、画像データ(画像情報)を複数の予測ブロックに分割し、分割した予測ブロック単位で予測を行い、予測画像と入力画像の差分(残差)を直交変換し、得られた変換係数を量子化した上で、量子化された変換係数の可変長符号化により符号化する。差分(残差)の直交変換は、予測ブロックと同一の、あるいは、予測ブロックとは独立に定められた変換ブロック単位で行われる。このような符号化方法では、予測を行う単位もしくは直交変換を実行する単位の境界において大きな歪み(いわゆる、ブロックノイズ)が生じやすい。また、ブロックノイズ以外にも、ボケやモスキートノイズなどさまざまな符号化ノイズが発生する。
これらの歪みを低減するために、予測の際に参照画像として利用される復号画像にフィルタ処理を行う技術が開示されている。
非特許文献1には、フィルタ対象画素の周囲の5×5もしくは7×7もしくは9×9画素の重み付和によって空間的なフィルタ処理を行う適応ループフィルタ(AdaptiveLoopFilter、以下ALF)と呼ばれる技術が開示されている。ALFでは既に符号化した重み係数を用いて予測符号化し、重み係数の予測誤差を符号化することで重み係数の符号量の低減が行われる。
非特許文献2には、ALFの入力信号を1つから3つに増やした方法が開示されている。この3入力ALFでは、復号画像のノイズを除去するデノイジングフィルタ(DNF)を備え、DNF後の復号画像と、予測画像、残差画像に対して、各々重み係数との積和を算出することによって、フィルタ処理が行われる。なお、DNFは、周波数領域における微小係数の除去によって行われる。3入力ALFにおいても、重み係数の予測符号化が行われる。重み係数の符号化は、DNF後画像、予測画像、誤差画像の順で行われ、予測画像の中心要素にかかる重み係数は、DNF後画像の中心要素にかかる符号化済みの重み係数から予測され差分値が符号化される。誤差画像の中心要素にかかる重み係数は、DNF後画像の中心要素にかかる復号済みの重み係数と、予測画像の中心要素にかかる重み係数とから予測され差分値が符号化される。復号処理においても、重み係数の予測は符号化と同じ順で行われる
なお、上述のALFでは、ピクチャあるいはスライスごとに、フィルタが適用された後の参照画像と原画像との誤差が最小となる重み係数を定める。
「VCEG-AI18」,Telecommunication Standardization Sector,35th Mee-ting:Berlin,Germany,07/2008 「JCTVC-A114」、Description of video coding technology proposal by France Telecom, NTT, NTT DOCOMO, Panasonic and Technicolor, JCTVC Contribution JCTVC-A114, Dresden, Germany, April 2010.
しかしながら、非特許文献1のALFは、入力信号が1つであるから、入力信号が複数に増えた場合に有効な重み係数の符号化方法は明らかとされていない。
非特許文献1の3入力ALFは、入力信号が3つであり、予測画像の中心要素にかかる重み係数、誤差画像の中心要素にかかる重み係数が予測されるが、入力信号の性質を十分に活かしていないために予測精度が低いという課題があった。予測精度が低い場合には、重み係数の符号量が増加するという問題が生じる。
発明者は、上記の問題に鑑み、複数種別の信号を入力が可能な適応フィルタで用いられるフィルタ係数に関する効率的な予測方法に関する知見を得た。
上記の問題を解決するために、複数種別の信号を入力が可能な適応フィルタを備える動画像復号装置であって、符号化データからフィルタ係数の可変長符号復号を行う可変長符号復号部と、復号済みのフィルタ係数を用いて、復号対象のフィルタ係数の予測値を算出するフィルタ係数予測部とを備える動画像復号装置であって、さらに、前記フィルタ係数予測部は、フィルタ係数毎に定まる寄与率とフィルタ係数との積和によって算出される重み係数和を算出する重み係数和算出手段を備えることを特徴とする、
上記のように構成された本発明に係る動画像復号装置は、入力画像として複数種別の信号が存在する場合にも適用可能な重み係数和算出手段によって、フィルタ係数を精度よく予測することが可能である。そのため、予測差分値として符号化されるフィルタ係数の符号量を低減することができる。
また、上記、重み係数算出手段によって用いられる寄与率は、フィルタ係数がかかる信号の種別に応じて定まる種別寄与率と、フィルタ係数がかかる信号の数である参照信号数の積で算出される値であることを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、フィルタ係数がかかる信号の数である参照信号数だけでなく、入力の信号の種別に応じて適当な寄与率を用いて重み係数和を算出するため、フィルタ係数をさらに精度よく予測することが可能である。
また、上記、フィルタ係数予測部では、適応フィルタのフィルタ係数の一つであるオフセットを予測することを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、オフセット成分を精度よく予測することが可能である。
また、上記、動画像復号装置において、ノイズ低減フィルタ手段を備え、ノイズ低減フィルタ手段の出力を適応フィルタの入力の一つとすることが可能な動画像復号装置であって、フィルタ係数予測部では、ノイズ低減フィルタ手段の出力であるノイズ低減処理後の復号画像(NRF後画像)の中心要素にかかるフィルタ係数を予測することを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、複数種別の信号を入力が可能な適応フィルタのフィルタ係数のうち、最も大きな値になることが多い、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数を精度よく予測することができるため、フィルタ係数の符号量を低減することができる。
また、上記、動画像復号装置は、復号画像とノイズ低減フィルタ手段の出力を適応フィルタの入力とすることが可能な動画像復号装置であって、フィルタ係数予測部では、復号画像の中心要素にかかるフィルタ係数とNRF後画像の中心要素にかかるフィルタ係数を予測することを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、復号画像とノイズ低減後の復号画像を用いることによって、ノイズ低減強度が調整可能な動画像復号装置において、最も大きな値になることが多い、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数を精度よく予測することができるため、フィルタ係数の符号量を低減することができる。
また、上記、動画像復号装置は、フィルタ予測部として、さらにフィルタ係数予測部は、過去に復号したフィルタセットに含まれるフィルタ係数を用いてフィルタ係数の予測を行うフィルタセット間予測部と、同一フィルタセット内で既に復号したフィルタ係数を用いてフィルタ係数の予測を行うフィルタセット内予測部を備え、さらに、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数をフィルタセット内予測部を用いて予測し、それ以外のフィルタ係数の予測をフィルタセット間予測部を用いて予測することを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、最も大きな値になることが多い、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数について精度よく予測することが可能なフィルタセット内予測を用い、それ以外のフィルタ係数についてはフィルタセット間予測を用いることによって、小数のフィルタ係数に対して高精度に予測可能であるというフィルタセット内予測と、多くのフィルタ係数に関して予測が可能であるというフィルタセット間予測の両者の特徴を活かすことができる。そのため、フィルタ係数の符号量を低減することができる。
また、上記動画像復号装置は、予測画像と残差画像とノイズ低減フィルタ手段の出力を適応フィルタの入力とすることが可能な動画像復号装置であって、さらにノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数を予測するフィルタ係数予測部を備えることを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、予測画像と復号画像とノイズ低減後の復号画像を用いることによって、自由度が高くノイズ低減強度が調整可能な動画像復号装置において、最も大きな値になることが多い、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数を精度よく予測することができるため、フィルタ係数の符号量を低減することができる。
また、上記、動画像復号装置において、適応フィルタの入力信号の種別に対する寄与率を算出する寄与率算出部では、復号画像に対する寄与率を1、ノイズ低減フィルタ後画像に対する寄与率を1とすることを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、入力信号に対して統計的に適当な寄与率を用いて重み係数和を算出することができることから、フィルタ係数を精度よく予測することができるため、フィルタ係数の符号量を低減することができる。
また、上記前記動画像復号装置において、適応フィルタの入力信号の種別に対する寄与率を算出する寄与率算出部では、予測画像に対する寄与率を1、残差画像に対する寄与率を0、NRF後画像に対する寄与率を1とすることを特徴とする。
上記のように構成された本発明に係る動画像復号装置は、入力信号に対して統計的に適当な寄与率を用いて重み係数和を算出することができることから、フィルタ係数を精度よく予測することができるため、フィルタ係数の符号量を低減することができる。
また、上記前記動画像復号装置において、適応フィルタの入力信号の種別に対する寄与率を算出する寄与率算出部では、0.5以下の所定の値Aに対し、予測画像に対する寄与率を1−A、残差画像に対する寄与率をA、NRF後画像に対する寄与率を1とする。
上記のように構成された本発明に係る動画像復号装置は、入力信号に対して統計的に適当な寄与率を用いて重み係数和を算出することができることから、フィルタ係数を精度よく予測することができるため、フィルタ係数の符号量を低減することができる。
また、複数種別の信号を入力が可能な適応フィルタを備える動画像符号化装置であって、予測対象以外のフィルタ係数を用いて、予測対象のフィルタ係数の予測値を算出するフィルタ係数予測部とを備える動画像符号化装置であって、さらに、前記フィルタ係数予測部は、フィルタ係数毎に定まる寄与率とフィルタ係数との積和によって算出される重み係数和を算出する重み係数和算出手段を備えることを特徴とする。
上記のように構成された本発明に係る動画像符号化装置は、入力画像として複数種別の信号が存在する場合にも適用可能な重み係数和算出手段によって、フィルタ係数を精度よく予測することが可能である。そのため、予測差分値として符号化されるフィルタ係数の符号量を低減することができる。
また、少なくともオフセットを含む適応フィルタ情報を含む符号化データであって、前記符号化データ中に符号化されたオフセットが、前記オフセット以外のフィルタ係数から算出された重み係数和を用いて予測された差分値であることを特徴とする符号化データ。
上記のように構成された本発明に係る符号化データは、オフセットが精度よく予測された差分値として符号化されている。そのため、フィルタ係数の符号量を低減された符号化データとなる。
また、復号画像にかかるフィルタ係数と、NRF後画像にかかるフィルタ係数とを含む、フィルタ係数セットを含む適応フィルタ情報を含む符号化データであって、少なくともNRF後画像の中心要素にかかるフィルタ係数が、NRF後画像の中心要素にかかるフィルタ係数以外から算出された重み係数和を用いて予測された差分値であることを特徴とする符号化データ。
上記のように構成された本発明に係る符号化データは、最も大きな値となることが多いNRF後画像の中心要素にかかるフィルタ係数が精度よく予測された差分値として符号化されている。そのため、フィルタ係数の符号量を低減された符号化データとなる。
また、予測画像にかかるフィルタ係数と、残差画像にかかるフィルタ係数と、NRF後画像にかかるフィルタ係数とを含む、フィルタ係数セットを含む適応フィルタ情報を含む符号化データであって、少なくともNRF後画像の中心要素にかかるフィルタ係数が、NRF後画像の中心要素にかかるフィルタ係数以外から算出された重み係数和を用いて予測された差分値であることを特徴とする符号化データ。
上記のように構成された本発明に係る符号化データは、最も大きな値となることが多いNRF後画像の中心要素にかかるフィルタ係数が精度よく予測された差分値として符号化されている。そのため、フィルタ係数の符号量を低減された符号化データとなる。
以上のように、本発明に係る動画像符号化装置および動画像復号装置は、入力画像として複数種別の信号が存在可能な場合にも適用可能な重み係数和算出手段によって、フィルタ係数を精度よく予測することが可能である。そのため、予測差分値として符号化されるフィルタ係数の符号量を低減することができる。そのため、符号化効率を高めることができる。
本発明の実施形態の動画像復号装置1のブロック図である。 本発明の実施形態の動画像符号化装置2のブロック図である。 本発明の実施形態のフィルタ係数予測復号部201のブロック図である。 本発明の実施形態のフィルタセット内フィルタ係数予測部202のブロック図である。 本発明の実施形態の寄与率算出部505のブロック図である。 本発明の実施形態の種別寄与率を示す図である。 本発明の実施形態のフィルタ係数予測復号部201´のブロック図である。 本発明の実施形態のフィルタセット間フィルタ係数予測部203のブロック図である。 本発明の実施形態のループフィルタ部120のブロック図である。 本発明の実施形態のNRF部301のブロック図である。 本発明の実施形態の境界を説明するための図である。 本発明の実施形態の適応フィルタ部302を説明するための図である。 本発明の実施形態のフィルタ係数予測符号化部211のブロック図である。 本発明の実施形態のフィルタ係数予測符号化部211´のブロック図である。 本発明の実施形態の動画像復号装置1´のブロック図である。 本発明の実施形態の動画像符号化装置2´のブロック図である。 本発明の実施形態にかかる重み係数の構成を示す図である。 本発明の実施形態の動画像復号装置1および動画像符号化装置2が扱う符号化データの構造を示す図である。 本発明の実施形態の動画像復号装置1´および動画像符号化装置2´が扱う符号化データの構造を示す図である。 本発明の実施形態の動画像復号装置1および動画像符号化装置2が扱うフィルタセットの具体例を示す図。 本発明の実施形態の動画像復号装置1´および動画像符号化装置2´が扱うフィルタセットの具体例を示す図。 本発明の実施形態の適応フィルタ部302´を説明するための図である。
(実施形態1)
本実施形態に係る動画像復号装置1の説明に先立ち、本実施形態に係る動画像符号化装置2及び動画像復号装置1で用いられる適応フィルタについて簡単に説明する。次に、上記適応フィルタで用いられるフィルタ係数の予測方法の概念を説明する。
適応フィルタとは、原画像と適応フィルタ処理の出力画像との二乗誤差が最小となるように最適化されたフィルタ係数を用いたウィナーフィルタである。動画像符号化装置で算出された最適なフィルタ係数は、符号化データを通じて動画像復号装置に伝送される。動画像復号装置では、符号化データからフィルタ係数を復号し、復号したフィルタ係数と適応フィルタの入力信号との積和によってフィルタ処理を行う。
適応フィルタの入力信号としては、複数種類の信号を用いることが可能であるが、本実施形態では、動画像復号装置で得られる復号画像の他、復号画像にノイズ低減フィルタ(NoiseReductionFilter、NRFと呼ぶ)を施した後の復号画像も入力信号とする。以下、ノイズ低減フィルタの入力画像である復号画像をNRF前画像、ノイズ低減フィルタ後の画像をNRF後画像と呼ぶ。
NRF前画像、NRF後画像の2つの入力を備える適応フィルタは、以下の式(1−1)で表現される。
ここで、SALFは適応フィルタ後の画素値、SdecはNRF前画像の画素値(NRF前画素値)、SnrfはNRF後画像の画素値(NRF後画素値)である。(u、v)は、フィルタ対象画素の位置(x、y)からの相対位置を示す。a(u、v)、b(u、v)は各々、相対位置(u、v)に対応するNRF前画素値にかかる重み係数、相対位置(u、v)に対応するNRF後画素値にかかる重み係数である。oはオフセットである。Rdecは、NRF前画像のフィルタ処理において参照される領域(以下、「フィルタ参照領域Rdec」と呼ぶ)を示している。Rnrfは、NRF後画像のフィルタ処理において参照される領域(以下、「フィルタ参照領域Rnrf」と呼ぶ)を示している。フィルタ参照領域Rdec及びRnrfは、フィルタ後の画素値を算出する対象となる画素(フィルタ対象画素)の位置に応じて、復号画像Sdec及びNRF後画像Snrf上に設定される。フィルタ参照領域RdecはM×Mの矩形領域であり、フィルタ参照領域RnrfはN×Nの矩形領域である。
1次元インデックスkが一組の(u、v)に対応すると仮定すると、式(1−1)は、2次元インデックスu、vの代わりに一次元インデックスkを用いて表すことができる。式(1−1´)のように表現できる。
ここでNumM、NumNは各々、NRF前画像およびNRF後画像に対する重み係数の数である。
式(1−1)の両辺をスライス内での平均をとると、以下の式(1−2)が得られる。なお、E(x)はxのスライス平均をとる演算を示す。
なお、オフセットはスライス内で固定の定数であるからE(o)=oとした。
ここで、以下の式(1−3a)、式(1−3b)を仮定する。
式(1―3a)、式(1−3b)に加え、さらにオフセットo=0と仮定すると以下の式(1−4a)が得られる。
式(1−4a)の両辺をE(SALF)で割ると、次の式式(1−4b)が得られる。
寄与率mag_a、寄与率mag_bを以下の式(1−5a)、(1−5b)で定義する。
寄与率を用いると式(1−4b)は、以下の式(1−6)で表現される。
式(1−6)より、重み係数に寄与率をかけて得られる和(以下、重み係数和と呼ぶ)は約1になる性質をもつ。寄与率mag_a、mag_bが1である場合には、以下の式(1−6´)が成り立つ。
この入力信号の寄与率を考慮した重み線形和が約1である性質を利用して重み係数を予測する。
例えば、NRF後画像にかかる重み係数の一つbi(iは予測対象の重み係数を示すインデックスで、iは0からNumN−1までの値をとる)を予測する場合、予測値pred_biは、以下のように得ることができる。式(1―6)において、予測対象の重み係数bi以外の和、予測対象の重み係数biをpred_biに置き換えて得られる和に分けて表現すると、以下の式(1−7a)が得られる。
ここで、第2項のΣ演算は、和の算出範囲をk=0..NumN−1、k≒iと表現しているが、これは0からNumN−1値で、かつ、iを除く値についての和を求めることになる。これは0からi―1までとi+1からNumN−1までの和を求めることに相当する。以下の式においてもこの表現方法を適用する。
さらにpred_biに対して変形すると、式(1−7b)が得られる。
同様にaiの予測値pred_aiは以下の式(1−7c)で得られる。
上記方法では、重み係数のうち1つの重み係数が予測できる。
以下、2つ以上の重み係数を予測する場合を説明する。予測対象の重み係数をai、bjとし、aiの予測値ai_pred、bjの予測値bj_predとする。i、jは予測対象の重み係数を示すインデックスであり、iは0からNumM−1までの値、jは0からNumN−1までの値である。このとき、式(1−6)から以下の式(1−8)が得られる。
ここで、予測対象とする複数の重み係数が全て等しいと仮定してai=bj=tとおく。この場合、予測値も等しいと考えられることからpred_ai=pred_bj=pred_tとなり、式(1−8)は以下の式(1−9)のように変形できる。
式(1−9)をさらに変形すると、次の式(1−10)を得る。
予測対象とする複数の重み係数が全て等しいという仮定は、対象とする重み係数が比較的大きな値を持つ、すなわち、適応フィルタに用いられる各入力信号の中心要素にかかる重み係数同士の場合は妥当であることが実験から分かっている
(オフセット予測の概念)
式(1−2)を変形すると、以下の式(1−11)が得られる。
続いて、式(1−3a)と式(1−3b)を仮定するとさらに以下の式(1−12)にように変形できる。
さらに、寄与率を用いて変形すると、式(1−13)が得られる。
式(1−13)は、重み係数と寄与率の積和を1から引いた値にSALFの平均値をかけることによって、オフセットoの予測値が得られることを意味する。AVEVALがSALFの期待値であり、sumは、寄与率と重み係数の積和とすると、オフセットoの予測値pred_oを算出する式は、以下の式(1−14)によって得られる。
なお、上記の重み係数予測の概念、および、オフセット予測の概念においては、入力の種別に応じた寄与率(種別寄与率)については考慮されているが、後述のフィルタ係数の量子化や対称性に関しては考慮されていない。これらを考慮した予測については、後述の予測手段の説明において示す。
次に、本実施形態に係る動画像符号化装置2によって生成され、動画像復号装置1によって復号される符号化データの構成について、図18を参照して説明する。
符号化データは、一連の画像データ(ピクチャ)から構成されている。図18に示すように、一つのピクチャは複数のスライスから構成される。スライスは、適応フィルタ情報とマクロブロックデータ(MBデータ)から構成される。MBデータは、復号画像を生成するための情報であり、ブロックタイプ、予測ブロックサイズ、予測パラメータ、変換ブロックサイズ、残差情報から構成される。ここではスライス単位で、適応フィルタ情報を符号化しているが、フレーム単位など異なる単位で符号化しても構わない。
適応フィルタ情報は、フレームメモリに格納された復号画像に対して、適応フィルタ処理を制御するために使用される情報であり、フィルタのオンオフを制御するオンオフ情報、2次元フィルタにおけるフィルタのサイズを示すタップ数、1つ以上のフィルタ係数から構成されるフィルタ係数セットである。タップ数はさらにNRF前画像にかかるフィルタのタップ数を示すタップ数M、NRF後画像にかかるフィルタのタップ数を示すタップ数Nから構成され、フィルタ係数セットは、NRF前重み係数a(k=0〜NumM−1)、NRF後重み係数b(k=0〜NumN−1)、オフセットoから構成される。なお、M、Nは、1、3、5の何れかの値をとるものとし、NumMおよびNumNは、NRF前画像にかかる重み係数の数、NRF後画像にかかる重み係数の数である。タップ数M、Nと重み係数の数はNumM=(M×M+1)/2、NumN=(N×N+1)/2の関係がある。なお、タップ数M及びタップ数Nの一方もしくは両方は明示的に符号化することなく予め決められた固定値を用いても良い。例えばMであれば1、Nであれば5であっても良い。
NRF前重み係数a、NRF後重み係数b、および、オフセットoは、量子化および予測符号化される。一般にウィナーフィルタの重み係数およびオフセットは小数であるが、符号化データ中には、量子化により整数化した値が用いられる。例えば、量子化の粗さを示すビット深度がbit_depthビットである場合には、小数精度の重み係数に、1<<bit_depthを乗じて、整数化した値が用いられる。なお、<<は、左シフトを示す記号である。以下、重み係数とオフセットを合わせてフィルタ係数と呼ぶ。
(重み係数の構成)
図17を参照して符号化データ中の重み係数の構成と、2次元フィルタにおける重み係数の対応位置を説明する。図17(a)、(b)、(c)は、各々タップ数が1、3、5の場合の重み係数を示す。図の左側は符号化データ中の重み係数の構成であり、各々1、5、13個の重み係数が一次元的に順序づけられて構成されている。図17の右側は2次元フィルタとして用いられる場合の重み係数の対応位置を示すものである。2次元フィルタは、フィルタ対象画素およびその周囲に位置する画素値に対応する重み係数を乗算して得られる加重平均を算出するフィルタである。図17においては、フィルタ対象画素からみて点対称に位置する画素に対して同じ重み係数が割り当てられている。
(動画像復号装置1)
本発明を適用した動画像復号装置について、図1を参照しつつ以下に説明する。図1は、第1実施形態に係る動画像復号装置1の構成を示すブロック図である。
図1に示すように、動画像復号装置1は、予測部111と、可変長符号化復号部114と、逆量子化部115と、逆変換部116と、フレームメモリ117と、適応フィルタ情報保存部119と、フィルタ係数予測復号部201と、ループフィルタ部120と、加算部109とから構成されている。動画像復号装置1の動作について以下に説明する。
動画像復号装置1に入力された符号化データは、まず、可変長符号化復号部114に入力される。可変長符号化復号部114は、符号化データの可変長復号により、フィルタ処理に用いる重み係数を含む適応フィルタ情報、予測方法および変換方法を示すMBパラメータ、変換・量子化された変換係数である残差情報を復号する。
逆量子化部115は、可変長符号化復号部114より入力された変換・量子化された残差画像を逆量子化する。逆変換部116は、逆量子化部115より入力された逆量子化された信号を逆変換し、残差画像を生成する。
予測部111は、可変長符号化復号部114より復号されたMBパラメータが入力され、当該MBパラメータに従って、フレームメモリ117に格納された復号画像(復号済みの画像)を用いて、予測画像を生成する。MBパラメータは、ブロックタイプと予測ブロックサイズ、変換ブロックサイズ、予測パラメータから構成される。ブロックタイプはイントラブロックかインターブロックかを示す。イントラブロックの場合には後述のループフィルタ処理前の復号画像(フレームメモリの画像)を参照して予測画像を生成し、インターブロックの場合にはループフィルタ処理後の復号画像を参照して予測画像を生成する。この実施形態では、予測ブロックサイズは予測のブロックサイズが16×16、8×8、4×4の何れであるかを示し、変換ブロックサイズは変換のブロックサイズが16×16、8×8、4×4の何れであるかを示す。予測パラメータはブロックタイプにより異なり、イントラブロックの場合には、DC予測を用いるか、方向予測を用いるかを示すイントラ予測モードである。インターブロックの場合には、動きベクトル、参照インデックスである。なお、参照インデックスは、フレームメモリに参照可能なフレームが複数存在する場合に、参照フレームを指定するための識別子である。なお、ブロックタイプ、予測ブロックサイズ、変換ブロックサイズ、予測パラメータなどはこの構成に限らない。
加算部109は、予測部111より入力された予測画像と、逆変換部116より入力された残差画像の加算により、復号画像を生成し、フレームメモリ117に格納する。
可変長符号化復号部114で可変長復号された適応フィルタ情報に含まれる重み係数は、その一部もしくは全てが予測符号化されたものである。予測符号化されていない場合は重み係数自体であり、予測符号化されている場合はフィルタ係数の予測差分値である。ここでは、両者を合わせて、符号化された時点での値をフィルタ係数符号化値と呼ぶ。これらフィルタ係数符号化値は一度、適応フィルタ情報保存部119に保存される。
フィルタ係数予測復号部201は、適応フィルタ情報保存部119に保存されたフィルタ係数符号化値から、フィルタ係数を復元する。復元された重み係数は、再度、適応フィルタ情報保存部119に保存される。
ループフィルタ部120は、適応フィルタ情報保存部119に保存され、復元された適応フィルタ情報を読み出し、フレームメモリ117に格納された復号画像のフィルタ処理を行い、再度フレームメモリに117に書き出す。
(フィルタ係数予測復号部201)
ここで、フィルタ係数予測復号部201について図3を用いて説明する。フィルタ係数予測復号部201は、フィルタセット内フィルタ係数予測部202と、加算部205から構成される。フィルタ係数予測復号部201では、差分値から対象となるフィルタ係数を復元する。対象となるフィルタ係数は一つであっても複数であっても良いが、復元は一つ一つ行われる。フィルタセット内フィルタ係数予測部202では、適応フィルタ情報保存部119から入力された、現スライス内の他のフィルタ係数を用いて、対象となるフィルタ係数の予測値を算出する。加算部205では算出したフィルタ係数の予測値と、符号化データから復号されたフィルタ係数の差分値の和を算出することで、フィルタ係数が復元される。
(フィルタセット内フィルタ係数予測部202)
フィルタセット内フィルタ係数予測部202は、図4に示すように予測対象係数特定部501と、重み係数和算出部502と、フィルタ係数予測部503と、寄与率算出部505から構成される。フィルタセット内フィルタ係数予測部202は、予測符号化されたフィルタ係数に対して、フィルタ係数の予測値を算出し、差分値であるフィルタ係数符号化値との和から、フィルタ係数を復元する。
フィルタセット内フィルタ係数予測部202には、重み係数の個数NumM、NumN及び、フィルタ係数が入力される。フィルタ係数の数は、NumM+NumN+1個であり、NRF前画像にかかる重み係数、NRF後画像にかかる重み係数、オフセットの順に入力される。入力される順序を示す値をインデックスlと呼ぶ。インデックスlは0からNumM+NumNの値をとる。
(予測対象係数特定部501)
予測対象係数特定部501には、フィルタ係数の個数NumM、NumN及び、フィルタ係数が入力される。まず、予測対象係数特定部501は、インデックスlを用いて、フィルタセット内フィルタ係数予測部202に入力された各フィルタ係数が、予測されたフィルタ係数(差分値)であるか、フィルタ係数自体であるかを特定する。
フィルタセット内フィルタ係数予測部202に入力されたフィルタ係数がフィルタ係数自体であれば、そのフィルタ係数の値をそのまま、重み係数和算出部502に出力する。予測されたフィルタ係数であれば0を重み係数和算出部502に出力する。
(重み係数和算出部502)
重み係数和算出部502では、重み係数和sumを以下の式(5−2)により算出する。
なお、mag(l)は、インデックスlの重み係数w(l)の寄与率を示し、後述の寄与率算出部505で算出される。
予測されたフィルタ係数については、予め予測対象係数特定部501において0として入力されているため、重み係数和sumの算出には用いられない。
なお、重み係数和の算出を簡単にするために、差分値であるフィルタ係数の値を0とする処理を用いているが、これを避けて和を算出するようにすれば、寄与率算出部505に予測されたフィルタ係数を入力する必要はない。
(フィルタ係数予測値部503)
フィルタ係数予測値部503では、予測対象とするフィルタ係数の種類および予測されたフィルタ係数の数に応じて、以下のように予測値を算出する。
予測対象が1つの重み係数である場合には、重み係数和sumから、以下の式(5−3)を用いて重み係数の予測値predを算出する。
なお、bit_depthは、重み係数の量子化の精度を示し、magは予測対象の重み係数の寄与率である。寄与率magは寄与率算出部505で算出する。重み係数の予測対象が1つの場合には、差分値として符号化された重み係数が1つである場合と、差分値として符号化された重み係数が複数存在するときに最後に復元する重み係数1つに適用する場合がある。
予測対象が重み係数であり、さらに複数ある場合には、重み係数和sumから、以下の式(5−3´)を用いて重み係数の予測値を算出する。
ここでsum_magは、複数個の重み係数の寄与率の和である。
予測符号化された重み係数が複数ある場合には、1個の予測値の算出、復元を行った後に、繰り返し、式(5−3´)で示される予測値算出を行い、復元することが好ましい。例えば、予測符号化された重み係数が3個である場合には、最初に、最後から3つ目の重み係数について予測値算出、復元を行い、次に、最後から2つ目の重み係数について予測値算出、復元を行い、最後に、式(5−3)を用いて、最後の重み係数について予測値算出、復元を行うことが好ましい。
予測対象がオフセットである場合には、重み係数和sumから、以下の式(5−3´´)を用いて予測値pred_oを算出する。
なおAVEVALは所定の値であり、復号画像のスライス平均値が好ましい。但し、スライス平均値を求める処理を省略するために、固定の値を用いても構わない。例えば、ループフィルタがかかる復号画像が輝度信号であり、その輝度信号のビット深度が8ビットの場合には90から100程度が好ましい。平均値はビット深度によって異なることから、輝度信号のビット深度luma_bit_depthが得られる場合には、例えば8ビットの場合に用いる値100をベースとして100<<(luma_bit_depth―8)のように、輝度信号のビット深度に応じてAVEVALを変化させると良い。ループフィルタがかかる復号画像が色差信号であり、そのビット深度が8ビットの場合には128が好ましい。色差信号のビット深度chroma_bit_depthが得られる場合には、128<<(chroma_bit_depth―8)のように、色差信号のビット深度に応じてAVEVALを変化させると良い。
(具体例)
寄与率算出部505を説明する前に、フィルタセット内フィルタ係数予測部202のより具体的な動作例をさらに具体的なフィルタ係数セットを用いて説明する。
図20は、具体的なフィルタ係数セットの構成を示す図である。ここでは、NumM=13、NumN=1の場合のフィルタ係数セットの例である。構成に示す通り、中心要素にかかる重み係数以外のNRF前画像にかかる重み係数、中心要素にかかる重み係数以外のNRF後画像にかかる重み係数、NRF前画像の中心要素にかかる重み係数、NRF後画像の中心要素にかかる重み係数の順に符号化されている。また、NRF前画像の中心要素にかかる重み係数aNumM−1(ここではa12)と、NRF後画像の中心要素にかかる重み係数bNumN−1(ここではb0)、オフセットoは予測符号化された差分値が、他のフィルタ係数はそれ自体が符号化されている。差分値として符号化されている値はa12´、b0´、o´というように´付きで表示されている。ここでは、予測対象となるフィルタ係数を符号化データの最後におく。また、符号化データ順、すなわち、a12、b0、oの順に復号する。なお、符号化データ順と復号順を同一とした方が処理が容易となりうるが、復号処理は符号化データ順によらずに可能である。
まず、フィルタセット内フィルタ係数予測部202では、式(5−3´)によりNRF前画像の中心要素にかかる重み係数a12の予測値が以下の式(26)のように得られる。
算出方法は後述するが、寄与率mag_a0〜mag_a11は2であり、寄与率mag_a12、mag_b0は1であるので、以下の式(27)となる。
式(27)に示すとおり、予測対象係数であるa12は重み係数和の算出には用いられない。分子は重み係数和算出部502で算出される重み係数和であり、分母は寄与率算出部505で算出される寄与率の和である。
以上により、重み係数a12は以下の式で復元できる。
a12=pred_a12+a12´
続いて、式(5−3)を用いてNRF後画像の中心要素にかかる重み係数b0の予測値式(28)が得られる。
ここでは、復元したa12を用いて予測値を算出する。
算出方法は後述するが、寄与率mag_a12は1、寄与率mag_ak(k=0〜11)は2、寄与率mag_b0は1であるので、以下の式(29)となる。
最後に、式(5−3´´)によりオフセットoの予測値が以下の式(30)により得られる。
ここで重み係数和は重み係数和算出部502で算出される。
(備考)
オフセットを除くフィルタ係数の場合、いずれの重み係数も以上の方式で予測可能である。そのため、NRF前画像の中心要素にかかる重み係数aNumM−1(以下ac)、NRF後画像の中心要素にかかる重み係数bNumN−1(以下bc)を復元したが、他の構成でも復元可能である。なお、ac、bcのcはcenterの略。
一般に、中心要素にかかる重み係数以外の重み係数は0に近い値をとることが多いため、0に近い値を短い符号長で符号化し、0から遠ざかるにつれて長い符号長で符号化する可変長符号化が用いられる。中心要素にかかる重み係数の場合には0に近くはないため、予測を行う予測値との差分値を符号化すると良い。予測する場合には、大きな重み係数ほど、また、予測精度が高い(予測差分値が小さい)ほど効果が大きい。
また、上記、重み係数和を用いた手法では、最後に復元される重み係数は高い精度で復元することができる。そのため、最後に復元される重み係数は、重み係数のうちで最大のものが好ましい。
本実施形態の適応フィルタでは、式(1−1)のように、NRF前画像とNRF後画像の重み付けを用いて、原画に近い画像を生成する。一般にノイズ低減フィルタをかけたNRF後画像の方が、NRF前画像よりも、原画に近いことが多い。複数の入力信号を適応フィルタに入力し原画を近似する場合には、原画に近い入力信号の重み係数が大きくなるという性質があり、発明者による実験的にも確かめられている。従って、NRF後画像を入力信号として用いる適応フィルタにおいては、NRF後画像の中心要素にかかる重み係数bcが最大の重み係数となることが多い。
次に大きな値となる重み係数はNRF前画像の中心要素にかかる重み係数acであることが実験的から得られている。従って、最後に符号化(復元)する重み係数をbc、その直前に符号化(復元)する重み係数をacとするのが良い。
なお、処理の簡単化のため、NRF後画像の中心要素にかかる重み係数bcだけを予測する。もしくは、NRF後画像の中心要素にかかる重み係数bcとオフセットoのみを予測する構成としても良い。
(寄与率算出部505)
ここで、寄与率算出部505について図5を用いて説明する。寄与率算出部505は種別特定部601と、種別寄与率算出部602と、参照信号数算出部603と、乗算部604から構成される。
(種別特定部601)
種別特定部601は、重み係数に対応するインデックスlを入力とし、各インデックスlから重み係数の種別情報を次のように出力する。インデックスlが0からNumM−1まではNRF前画像にかかるフィルタ係数であるので、重み係数の種別情報がNRF前画像であることを示す種別識別子(ここでは0)を出力する。インデックスlがNumMからNumM+NumN−1まではNRF後画像にかかるフィルタ係数であるので、重み係数の種別情報がNRF後画像であることを示す種別識別子(ここでは1)を出力する。インデックスlがNumM+NumNの場合にはオフセットであるので、重み係数の種別情報がオフセットであることを示す種別識別子(ここでは5)を出力する。
(種別寄与率算出部602)
種別寄与率算出部602は種別特定部601から種別情報を入力し、種別寄与率kind_magを出力する。本実施形態における種別寄与率kind_magは以下のように算出する。
種別がNRF前画像にかかるフィルタ係数もしくはNRF後画像にかかるフィルタ係数の場合(種別識別子が0もしくは1の場合)
kind_mag=1
種別がオフセットの場合(種別識別子が5の場合)
kind_mag=0
一般に、kind_magは、適応フィルタの入力信号の種別(重み係数がかかる重み係数の種別)毎に以下の式(6−2)を用いて算出される所定の値である。
kind_mag=E(適応フィルタの入力信号)/E(適応フィルタの出力信号)
(6−2)
ここでE(X)はXに対するスライス平均を表す。適応フィルタの入力信号とは、NRF前画像もしくはNRF後画像である。スライス平均E(X)とは、実験的にはスライスにおいてXの平均をとることによって求められる。しかし、実際には実験によって求める必要はなく、以下に説明するように予め概念的に定めておくことができる。
具体的には、復号画像(NRF前画像)のスライス平均と、適応フィルタの出力のスライス平均はほぼ等しいと考えられるため、式(6−2)によりNRF前画像にかかるフィルタ係数のkind_magは1と定められる。また、NRF後画像のスライス平均値と、適応フィルタの出力のスライス平均はほぼ等しいと考えられるため、NRF後画像にかかるフィルタ係数のkind_magも1と定められる。
なお、ここでは、入力の種別が、NRF前画像にかかるフィルタもしくはNRF後画像にかかるフィルタである場合は1、それ以外を0としているが、他の入力種別がある場合には、それに対応する値を算出する。例えば、入力種別が予測画像である場合、もしくは、残差画像である場合には実施形態2において説明する。
(参照信号数算出部603)
参照画像数算出部603は、インデックスlを入力とし、参照信号数ref_numを出力する。図17を再度参照してref_numの算出方法を以下に説明する。
図17において説明したように、一般に適応フィルタの重み係数は対称性を利用して符号化する重み係数の数を減らしていることが多い。対称性を利用する場合には、適応フィルタの入力信号の数よりも、適応フィルタに入力される重み係数の数の方が少なく、一つの重み係数が、複数の入力信号に対して用いられる。
参照信号数ref_numは、当該重み係数に対して参照される入力信号の数である。図17の例では、中心の画素にかかるフィルタ係数の参照信号数ref_numは1、それ以外の画素にかかるフィルタ係数の参照信号数ref_numは2となる。
なお、他の対称性を利用する、もしくは、対称性を利用しない方法も可能である。中心要素以外の画素にかかるフィルタ係数の参照信号数は、上下対称および左右対称の場合には2、上下および左右対称の場合には4になる。また、対称性を利用しない場合には参照信号数ref_numは1となる。
(乗算部604)
乗算部604は、式(6―4)に示すように種別寄与率kind_magと参照信号数ref_numの積により、寄与率magを算出する
mag = kind_mag × ref_num (6−4)
(フィルタセット間予測)
図7は、フィルタ係数予測復号部201の別の構成(フィルタ係数予測復号部201´)を示すブロック図であり、フィルタ係数予測復号部201´は、フィルタセット内フィルタ係数予測部202と、フィルタセット間フィルタ係数予測部203、予測方式切替部204、加算部205から構成される。
符号化データには、図18を用いて説明した通り、スライス毎に1つのフィルタセットが符号化される。フィルタセット内フィルタ係数予測部202は、当該スライスのフィルタセットに含まれる復号済みのフィルタ係数を用いてフィルタ係数を予測する手段である。
フィルタセット間フィルタ係数予測部203は既に復号された過去のスライスに含まれるフィルタセットを用いてフィルタ係数を予測する手段である。
予測方式切替部204は、予測対象のフィルタ係数がNRF後画像の中心要素にかかる重み係数bcである場合には、フィルタセット内フィルタ係数予測部202による予測値を用い、それ以外の場合には、フィルタセット間フィルタ係数予測部203による予測値を用いる。
加算部205はフィルタ係数の予測値と、差分値を加算してフィルタ係数を復元する。復元されたフィルタ係数は、適応フィルタ情報保存部119で保存される。
図8は、フィルタセット間フィルタ係数予測部203の構成を示すブロック図である。フィルタセット間フィルタ係数予測部203は、対応フィルタ係数参照部506から構成される。
対応フィルタ係数参照部506では、適応フィルタ情報保存部119に格納された過去のスライスで復号されたフィルタ係数セットを用いて、フィルタ係数の予測値を算出する。具体的には、同じ種別および同じ位置のフィルタ係数を予測値とする。現スライスtでのフィルタ値をNRF前のフィルタ係数をak(t)、NRF後のフィルタ係数をbk(t)、それらの予測値をpred_ak(t)、pred_bk(t)とすると、以下の式で予測値が得られる。
pred_ak(t) = ak(t−1) (5−6a)
pred_bk(t) = bk(t−1) (5−6b)
この式では、前スライスt−1のフィルタ係数を用いて予測値としている。なお、予測値として参照する前スライスt−1におけるタップ数が、予測対象である現スライスtにおけるタップ数よりも小さい場合など、対応するフィルタ係数が存在しない場合には、予測値を0とする。また、最初のスライスなど、既に復号されたフィルタ係数セットが存在しない場合にも、予測値を0とする。
上記の構成のフィルタ係数予測復号部201´は、最も大きな値になることが多い、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数について精度よく予測することが可能なフィルタセット内予測を用い、それ以外のフィルタ係数についてはフィルタセット間予測を用いることによって、小数のフィルタ係数に対して高精度に予測可能であるというフィルタセット内予測と、多くのフィルタ係数に関して予測が可能であるというフィルタセット間予測の両者の特徴を活かすことができる。そのため、フィルタ係数の符号量を低減することができる。
(ループフィルタ部120)
図9は、ループフィルタ部120の内部構成を示す図である。ループフィルタ部120は、ノイズ低減フィルタ部(NRF部)301と、適応フィルタ部302から構成される。
ループフィルタ部120は、フレームメモリ117に格納された復号画像と、適応フィルタ情報保存部119に格納された適応フィルタ情報を用いて、符号化歪みを低減した画像を生成する手段である。
NRF部301は、符号化ノイズを低減するフィルタであり、デブロッキングフィルタやデノイジングフィルタなどを用いることができる。適応フィルタ部302は、適応フィルタ情報に含まれる重み係数およびオフセットを用いて加重平均によりフィルタ処理を行う手段である。
適応フィルタ部302は、2つの入力画像を備え、一方がNRF部301で処理された復号画像(NRF後画像)であり、もう一方がNRF部301の処理前の復号画像(NRF前画像)である。なお、ループフィルタ部120、NRF部301、及び適応フィルタ部302の処理単位は、フレーム、スライス、ブロックのいずれかであっても画素であっても構わない。
(NRF部301)
ここで、NRF部301がデブロッキングフィルタである例について詳細に説明する。
図11は、ブロックの境界部分における画素を模式的に示した図である。図11では、互いに隣接するブロックのうち、一方のブロックの画素を画素Piとし、もう一方のブロックの画素を画素Qiとしている(iは0〜nまでの整数)。なお、画素Piおよび画素Qiにおけるiは、ブロック境界からの距離に相当する。
また、図11では、画素Piおよび画素Qiに対応する画素値をそれぞれ画素値piおよび画素値qiとして示しており、処理対象画素Pkにおける処理前の画素値pkに対応する処理後の画素値をpk´として示している。ここで、kは0からブロックサイズ以下の値をとる整数である(kは0〜n)。
すなわち、図11では、ブロック境界において隣接する2つのブロックのうち、一方のブロックの画素値を画素値pk(kは境界からの距離により定められる値)、他方のブロックの画素値を画素値qk(kは境界からの距離により定められる値)として表している。なお、図11では、境界が水平方向の境界であるのか、または垂直方向の境界であるのかについては区別していない。
図10は、NRF部301の内部構成を示す図である。NRF部301は、境界エッジ算出部401と、活性度算出部402と、NRF画素生成部403を備える。
境界エッジ算出部401は、下記の式(4−1)を用いて、境界のエッジ強度dを算出する。
d=ABS(p0−q0) (4−1)
活性度算出部402は、下記の式(4−2)を用いて、活性度を表す値apを算出する。活性度は境界およびフィルタ対象画素付近の凹凸の状態もしくは勾配の大きさを算出するものである。
ap=ABS(p2−p0) (4−2)
NRF画素生成部403は、算出された「d」および「ap」が、所定の閾値α、βに対して、d<α、かつ、ap<βである場合に以下のフィルタ処理を施す。
p0´=(p2+2×p1+2×p0+2×q0+q1)/8
p1´=(p2+p1+p0+q0)/4
p2´=(2×p3+3×p2+p1+p0+q0)/8
そうではない場合には、以下のフィルタを施す。
p0´=(2×p1+p0+q0)/4
NRF部301は、予測ブロックの境界および変換ブロックの境界に対して上記の処理を実行する。より具体的にはまず予測ブロック及び変換ブロックの垂直境界に処理を行い、続いて、予測ブロック及び変換ブロックの水平境界に処理を行う。これによりNRF後画素値Snrfを得る。
このように構成したNRF部301は、境界のエッジ強度または活性度が大きい場合に強いフィルタがかからないようにフィルタ強度を調整したブロックノイズ低減処理を行うことができる。
(適応フィルタ部302)
ここで、適応フィルタ部302について図12を用いて詳細に説明する。適応フィルタ部302は、復号画像適応重み付け部701と、NRF後画像適応重み付け部702と、シフト/除算部703を備える。復号画像適応重み付け部701は、タップ数Mおよび重み係数a(k=0〜NumM−1)とオフセットoを用いて、フレームメモリ117から入力された復号画像を用いてフィルタ処理を行う。NRF後画像適応重み付け部702は、タップ数Nおよび重み係数b(k=0〜NumN−1)と、NRF部301から入力された復号画像を用いてフィルタ処理を行う。
適応フィルタ部302は、下記の式(7−1)で表現されるフィルタ処理を行う。
ここでshiftは除算を実行するためのシフト値であり、フィルタ係数の量子化に用いたbit_depthと同じ値が用いられる。total2は、1<<(shift−1)で算出される値で丸め(四捨五入)に用いられる。なお式(7−1)の意味は、前述の式(1−1)とほぼ同じであるが、重み係数ak、bkおよびオフセットが量子化された後であるため、丸め及び除算が追加されている。フィルタ処理自体は式(1−1)と同様であるが演算を容易にするために、式(7−1)では整数化したフィルタ係数を用いることに伴い、丸め及び除算処理が追加されている。
(重み係数のインデックス)
ここで、符号化データから復号され、適応フィルタ情報保存部119に保存された、1次元インデックスで表示された重み係数a(k=0〜NumM−1)と、2次元インデックスで表示された重み係数a(u、v)の関係について説明する。まず2次元インデックス(u、v)より、次の式で得られるk0を計算し、さらにk0からkを計算することで1次元インデックスkを得る。
k0=(u+ofst)+(v+ofst)×M
ここでofst=M/2、u=―M/2〜M/2、v=−M/2〜M/2。
k=k0 (k0<(M×M+1)/2)
=(M×M―1)―k0 (それ以外)
以下、a(u、v)と表示される演算では、2次元インデックス(u、v)から1次元インデックスkに変換された後の値kを用いて表現されるaを用いる。
1次元の重み係数b(k=0〜NumN−1)と、上記2次元の重み係数b(u、v)との関係も同様であり、次の式で得られるk0を計算し、さらにk0からkを計算することで1次元インデックスkを得る。
k0=(u+ofst)+(v+ofst)×N
ここでofst=N/2、i=―N/2〜N/2、j=−N/2〜N/2。
k=k0 (k0<(N×N+1)/2)
=(N×N―1)―k0 (それ以外)
以下、b(u、v)と表示される演算では、2次元インデックス(u、v)から1次元インデックスkに変換された後の値kを用いて表現されるbを用いる。
適応フィルタ部302は、復号画像適応重み付け部701、NRF後画像適応重み付け部702、シフト/除算部703を用いて先に説明した式(7−1)の処理を行う。
復号画像適応重み付け部701は、
式(7−1)の第1項、及び、オフセットの加算
Σa(u、v)×Sdec(x+u、y+v)+o
を実行する。
NRF後画像適応重み付け部702は式(7−1)の第2項、すなわち、
Σb(u、v)×Snrf(x+u、y+v)
を実行する。
シフト/除算部703はラウンド付きシフト演算による除算rdiv(x)を行う。この処理は、入力信号をxとすると、以下の関数で表現できる
rdiv(x)=(x+total2)>>shift
このような適応フィルタ処理によって、NRF前画素値とNRF後画素値の両者の空間的な重み演算により効果的に歪みの低減を行うことができる。
(動画像符号化装置2)
続いて、本発明を適用した画像符号化装置について、図を参照して説明する。
図2は、動画像符号化装置2の構成を示すブロック図である。動画像符号化装置1と同様の部材に関しては、同一の符号を付し、その説明を省略する。
図2に示すように、動画像符号化装置2は、予測部111と、変換部112と、量子化部113と、可変長符号化部114と、逆量子化部115と、逆変換部116と、フレームメモリ117と、適応フィルタ情報算出部118と適応フィルタ情報保存部119とループフィルタ部120、フィルタ係数予測符号化部211と、減算部107、加算部109とから構成される。
動画像符号化装置2は、フレームメモリ117に格納された局所復号画像の歪みを低減するループフィルタ部120を備え、ループフィルタ部120を制御するための適応フィルタ情報を格納する適応フィルタ情報保存部119を備える。以下、動画像符号化装置2の動作について説明する。
動画像符号化装置2に入力された画像はブロックに分解され、以下の処理がなされる。予測部111は、入力ブロックを近似する予測ブロックを生成する。減算部107は、入力ブロックと予測部111から出力される予測ブロックの差分値である差分値ブロックを計算する。
変換部112は、減算部107から入力された差分値ブロックに対しDCT変換などにより変換係数を算出する。量子化部113は、量子化ステップにより定まるステップに従い、変換係数を量子化する。量子化された変換係数は、可変長符号化部114により符号化され外部に出力される。
逆量子化部115は、量子化された変換係数を逆量子化する。逆変換部116は、逆量子化された変換係数を逆変換し、残差ブロックを算出する。加算部109は、残差ブロックと予測ブロックの和を計算し、入力ブロックを再生する。再生されたブロックは、フレームメモリ117に格納される。
適応フィルタ情報算出部118は、適応フィルタ情報を算出する。算出された適応フィルタ情報は、適応フィルタ情報保存部119に格納される。適応フィルタ情報保存部119に格納された適応フィルタ情報に含まれるフィルタ係数のうち、一部もしくは全てはフィルタ係数予測符号化部211で予測差分値に変換される。フィルタ係数もしくはフィルタ係数の予測差分値は、可変長符号化部114において符号化される。可変長符号化部114は、適応フィルタ情報だけでなく予測方法を示す情報と変換係数も符号化する。
算出された適応フィルタ情報は適応フィルタ情報保存部119に格納される。ループフィルタ部120は、適応フィルタ情報保存部119に保存された適応フィルタ情報を読み出し、その値に従って、フレームメモリ117に格納された局所復号画像にフィルタ処理を行う。フィルタ処理された画像はフレームメモリ117に再度格納される。
適応フィルタ情報保存部119、ループフィルタ部120の動作は、動画像復号装置1と同一であるので、説明を省略する。
(フィルタ係数予測符号化部211)
図13は、フィルタ係数予測符号化部211の構成を示す図である。フィルタ係数予測符号化部211は、フィルタセット内フィルタ係数予測部202と減算部206から構成される。フィルタセット内フィルタ係数予測部202は動画像復号装置1において先に説明した通りであり、フィルタ係数の予測値を算出する。減算部206は、フィルタ係数と予測値の差分を算出する。算出された差分値は、可変長符号化部114において符号化される。
図14は、フィルタ係数予測符号化部2111の別の構成(フィルタ係数予測符号化部211´)を示す図である。フィルタ係数予測符号化部211´は、フィルタセット内フィルタ係数予測部202、フィルタセット内フィルタ係数予測部203、予測方式切替部204、減算部206から構成される。フィルタセット内フィルタ係数予測部202、フィルタセット内フィルタ係数予測部203、予測方式切替部204は動画像復号装置1において先に説明した通りであり、フィルタ係数の予測値を算出する。減算部206は、フィルタ係数と予測値の差分を算出する。算出された差分値は、可変長符号化部114において符号化される。
(適応フィルタ情報算出部118)
以下、適応フィルタ情報算出部118の動作を説明する。適応フィルタ情報算出部118は、入力画像Sorgと復号画像SdecおよびNRF後の画素値Snrfから、以下の式(8−1)を最小化する重み係数af(k=0〜NumM−1)とbf(k=0〜NumN−1)、オフセットofの推定値を最小二乗法により求める。ここでfはfloatの略であり、最小二乗法では小数点数として重み係数を算出することを意味する。
ここで、Sorgは原画の画素値、SdecはNRF前画像の画素値、SnrfはNRF後画像の画素値である。(u、v)は、フィルタ対象画素の位置(x、y)からの相対位置を示す。a(u、v)、b(u、v)は各々、相対位置(u、v)に対応するNRF前画素値およびNRF後画素値にかかる重み係数である。oはオフセットである。Rdecは、フィルタ参照領域Rdec、Rnrfはフィルタ参照領域Rnrdである。Rsliceは適応フィルタ処理が行われる領域(フィルタ対象領域)である。フィルタ参照領域Rdec及びRnrfは、フィルタ後の画素値を算出する対象となる画素(フィルタ対象画素)の位置に応じて、復号画像Sdec及びSnrf上に設定される。フィルタ参照領域RdecはM×Mの矩形領域であり、フィルタ参照領域RnrfはN×Nの矩形領域である。
なお、aとaf(u、v)の関係、bとbf(u、v)の関係は既に動画像復号装置1の説明で示したとおりである。
最小二乗法に先立ち、以下の式変形を行う。式(8−1)を重み係数afとbf、オフセットofをパラメータとする以下の式(8−2)に直す。
ここでak、bkとしては、相対位置(u、v)に対応する重み係数ak、bkを用いる。
さらに、Σで示される和として、(u、v)に関する和から、kに関する和に置き替える。
ここでkから(u、v)への対応関係は2通りあるため、一方を(uk、vk)、もう一方を(uk´、vk´)と表現する。
kから(u、v)、(u´、v´)への変換は以下の演算で行われる。まず、以下の式を用いてkからk0とk0´を計算する
k0 =k
k0´=(M×M−1)―k
次に、k0とk0´から以下の式を用いてu、vを計算する。
u=(k0%M)−ofst
v=(k0/M)−ofst
u´=(k0´%M)−ofst
v´=(k0´/M)−ofst
ここで%は剰余を計算する演算、/は除算を行い小数点以下を切り捨てて整数化する演算、ofst=M/2である。
なお、Snrfに関しては上の式でMをNに置き替えた演算で(u、v)、(u´、v´)を計算する。
上記の置き替えにより、式(8−2)は式(8−3)として表現することができる。
最小二乗法では、式(8−3)をパラメータaf、bf、ofの式とみなして、各々のパラメータに対して偏微分を行い、これを0とする。これによって、正規方程式と呼ばれるパラメータの数NumM+NumN+1個の連立方程式が得られる。
得られた方程式をガウスの消去法などによって解くことにより、afの最適推定値afeと、bfの最適推定値bfe、ofの最適推定値ofeが得られる。
これらを重み係数の組を推定値zfeと呼ぶ。なお、NRF後の画素値Snrfは、ループフィルタ部120内のNRF部301を動作させて算出する。
最小二乗法の演算は、事前にNRF前画像にかかるフィルタのタップ数MとNRF後画像にかかるフィルタのタップ数Nを特定の値に定めて行われる。但し、最適なMとNの組み合わせを予め定めることは困難であることから、次に示す擬似コードで表現する処理によって可能な全ての組み合わせのMおよびNに対して最小二乗法を行い、最適なMとNの組み合わせを選択することで、最適化を行う。
COSTMIN=0x7FFFFFFF(十分大きな値、ここでは32ビット符号付き整数の最大値を設定)
LOOP(M=1、3、5){
LOOP(N=1、3、5){
最小二乗法により重み係数zfeを得る
zfeを式(8−3)に代入して得られる二乗誤差の大きさをCOSTとする。
IF(COST <COSTMIN){
重み係数zfeを最適な重み係数zfbestとして保存
COST=COSTMIN


ここで算出された最適な重み係数セットをzfbest={afbest、bfbest、obbest}とする。次の式で示される演算で整数化し、適応フィルタ情報保存部119に保存する。
abest=(int){afbest×(1<<shift)}
bbest=(int){bfbest×(1<<shift)}
obest=(int){ofbest×(1<<shift)}
なお(int)は整数化を示す。
(実施形態2)
(動画像復号装置1´)
本実施形態に係る動画像復号装置1´の説明に先立ち、本実施形態に係る動画像符号化装置2´によって生成され、動画像復号装置1´によって復号される符号化データのうち適応フィルタ情報の構成について図19を参照して説明する。符号化データの基本的な構成は第1の実施形態と同じく図18の通りであるが、適応フィルタ情報の詳細構成が異なる。
図19に示すように、フィルタのオンオフを制御するオンオフ情報、予測画像にかかるフィルタのタップ数を示すタップ数PN、残差画像にかかるフィルタのタップ数を示すタップ数EN、NRF後画像にかかるフィルタのタップ数を示すタップ数N、予測画像重み係数c(k=0〜NumPN−1)、残差画像重み係数d(k=0〜NumEN−1)、NRF後重み係数b(k=0〜NumN−1)、オフセットoから構成される。なお、PN、EN、Nは、1、3、5の何れかの値をとるものとし、NumPN、NumENおよびNumNは、予測画像にかかる重み係数の数、残差画像にかかる重み係数の数、NRF後画像にかかる重み係数の数である。なお、タップ数EN、PN、Nのいずれかもしくは全ては明示的に符号化することなく予め決められた固定値を用いても良い。
(第2の実施形態の基本概念)
続いて、本実施形態における適応フィルタの簡単な説明を行い、本実施形態での適応フィルタで使用される重み係数の予測に関するコンセプトを説明する。
本発明で用いられる適応フィルタ処理は、予測画像、残差画像、NRF後画像の3つの入力を備えるものであり、簡単には以下の式(10−1)で表現される。詳細については後述する。
ここで、SALFは適応フィルタ後の画素値、predは予測画像の画素値、errorは残差画像の画素値、SnrfはNRF後画素値である。(u、v)は、フィルタ対象画素の位置(x、y)からの相対位置を示す。c(u、v)、d(u、v)、b(u、v)は各々、相対位置(u、v)に対応する予測画像にかかる重み係数、残差画像にかかる重み係数、NRF後画像にかかる重み係数である。oはオフセットである。Rpredは、予測画像のフィルタ処理において参照される領域(以下、「フィルタ参照領域Rpred」と呼ぶ)を示している。Rerrorは、残差画像のフィルタ処理において参照される領域(以下、「フィルタ参照領域Rerror」と呼ぶ)を示している。Rnrfは、NRF後画像のフィルタ処理において参照される領域(以下、「フィルタ参照領域Rnrd」と呼ぶ)を示している。フィルタ参照領域Rpred、Rerror、Rnrfは、フィルタ後の画素値を算出する対象となる画素(フィルタ対象画素)の位置に応じて、予測画像pred、残差画像error、及びNRF後画像Snrf上に設定される。フィルタ参照領域Rpred、Rerror、Rnrfは各々PN×PNの矩形領域、EN×ENの矩形領域、N×Nの矩形領域である。
ここで、2次元インデックスu、vの代わりに一次元インデックスkを用いて表すと、式(10−1)は式(10−1´)のように表現できる。
ここでpred=pred(u、v)、error=error(u、v)、Snrf=Snrf(u、v)である。
式(10−1´)の両辺をスライス内での平均をとると、以下の式(10−2)が得られる。なお、E(x)はxのスライス平均をとる演算を示す。
さらに、以下の仮定、式(10−3a)、式(10−3b)、式(10−3c)を置く。
式(10−2)において、式(10−3a)、式(10−3b)、式(10−3c)を仮定し、オフセットo=0と仮定すると以下の式(10−4)が得られる。
ここで、以下の式で与えられる寄与率と呼ぶ値、mag_c、mag_d、mag_bを定義する。
mag_c=E(pred)/E(SALF) (10−5a)
mag_d=E(error)/E(SALF) (10−5b)
mag_b=E(Snrf)/E(SALF) (10−5c)
このとき、式(10−4)は、寄与率を用いて以下の式(10−6)で表現される。
これは、重み係数に寄与率をかけて得られる和(以下、重み係数和と呼ぶ)がほぼ1になることを意味する。
この入力信号の寄与率を考慮した重み線形和が1であるという性質を利用して重み係数を予測する。
例えば、NRF後画像にかかる重み係数の一つbiを予測する場合、予測値pred_biを、以下のように得ることができる。なお、iは予測対象の重み係数を示すインデックスで0からNumN−1までの値をとる。
pred_biに対して変形すると、式(10−7b)が得られる。
同様にciの予測値pred_ciは、式(10−7c)により得られる。
同様にdiの予測値pred_diは、式(10−7d)により得られる。
上記方法では、1つの重み係数が予測可能である。
以下、2つ以上の重み係数を予測する場合を説明する。予測対象の重み係数をci0、di1、bi2とし、ci0の予測値pred_ci0、djの予測値pred_di1、bi2の予測値pred_bi2とする。i0、i1、i2は予測対象の重み係数を示すインデックスであり、i0は0からNumPN−1まで、i1は0からNumEN−1、i2は0からNumN−1までの値をとる。なお、ここのインデックスは、重み係数和算出部の説明とは異なり、種別毎に個別のインデックスを与えて説明している。
このとき、式(10−6)から以下(10−8)の式が得られる。
ここで、ci0=di1=bi2=tである、つまり、予測対象とする複数の重み係数が全て等しいと仮定する。すると、予測値も等しいと考えられることからpred_ci0=pred_di1=pred_bi2=pred_tとなり、式(10−8)は以下の式(10−9)に変形できる。
さらに変形すると、次の式(10−10)を得る。この式により複数のフィルタ係数が差分値として符号化されている場合においても、予測対象とするフィルタ係数の予測値を算出することができる、
オフセットの予測においては3入力の場合の重み係数和を以下の式(10−13)で算出する。
続いて、式(5−3´´)によって、オフセットの予測値pred_oが算出される。
本発明を適用した動画像復号装置1´について、図15を参照しつつ以下に説明する。図15は、第2の実施形態に係る動画像復号装置1´の構成を示すブロック図である。
図15に示すように、動画像復号装置1´は、予測部111と、可変長符号化復号部114と、逆量子化部115と、逆変換部116と、フレームメモリ117と、適応フィルタ情報保存部119と、フィルタ係数予測復号部201と、ループフィルタ部120´と、加算部109から構成されている。動画像復号装置1´の動作について以下に説明する。可変長符号化復号部114、逆量子化部115と、逆変換部116と、フレームメモリ117、適応フィルタ情報保存部119、加算部109の第1の実施形態と同じため、説明を省略する。
(ループフィルタ部120´)
ループフィルタ部120´は、NRF部301と、適応フィルタ部302´から構成される。ループフィルタ部120´の特徴は、適応フィルタ部302´の入力信号として、NRF後画像と、予測画像#111と、残差画像#116の3つの信号を用いることにある。
(適応フィルタ部302´)
ここで、適応フィルタ部302´について図22を用いて詳細に説明する。適応フィルタ部302´は、予測画像適応重み付け部704と、残差画像適応重み付け部705とNRF後画像適応重み付け部702と、シフト/除算部703を備える。予測画像適応重み付け部704は、タップ数PNおよび重み係数c(k=0〜NumPN−1)とオフセットoを用いて、予測部111から入力された予測画像を用いてフィルタ処理を行う。残差画像適応重み付け部702は、タップ数ENおよび重み係数d(k=0〜NumEN−1)と残差画像を用いてフィルタ処理を行う。NRF後画像適応重み付け部702は、タップ数Nおよび重み係数b(k=0〜NumN−1)と、NRF部301から入力されたNRF後画像を用いてフィルタ処理を行う。なお、第2の実施形態においても対称性を利用することからNumPN=(PN×PN+1)/2、NumEN=(EN×EN+1)/2、NumN=(N×N+1)/2である。
適応フィルタ部302´は、下記の式(7−1´)で表現されるフィルタ処理を行う。
ここで、Snrf(x、y)はNRF後画素値、pred(x、y)は予測画像の値、error(x、y)は残差画像の値、SALF(x、y)は適応フィルタ後画素値である。(x、y)はフィルタ対象画素のフレーム内での位置で、フレームの幅w、フレームの高さをhとすると、0<=x<=w−1、0<=y<=h−1をとる。また、(u、v)は、フィルタ対象画素の位置(x、y)からの相対位置を示す。b(u、v)、c(u、v)、d(u、v)は各々、相対位置(u、v)に対応するNRF後画素値にかかる重み係数、予測画像にかかる重み係数、残差画像にかかる重み係数である。oはオフセット、shiftは除算を実行するためのシフト値である。Rpred、Rerror、Rnrfは既に説明したフィルタ参照領域Rpred、フィルタ参照領域Rerror、フィルタ参照領域Rnrfである。
(フィルタ係数予測復号部201)
フィルタ係数予測復号部201は概念的には第1の実施形態と同じ動作を行うが、細かい部分で動作が異なるため、相違点のみを説明する。
(具体例)
図21は、具体的なフィルタ係数セットの構成を示す図である。ここでは、NumPN=5、NumEN=1、NumN=13の場合のフィルタ係数セットの例である。構成に示す通り、中心要素にかかる重み係数以外の予測画像にかかる重み係数、中心要素にかかる重み係数以外の残差画像にかかる重み係数、中心要素にかかる重み係数以外のNRF後画像にかかる重み係数、予測画像の中心要素にかかる重み係数、残差画像の中心要素にかかる重み係数、NRF後画像の中心要素にかかる重み係数の順に符号化されている。また、予測画像の中心要素にかかる重み係数cNumPN−1(ここではc4)と、残差画像の中心要素にかかる重み係数dNumEN−1(ここではd0)、NRF後画像の中心要素にかかる重み係数bNumN−1(ここではb12)、オフセットoが予測符号化されており、他のフィルタ係数はそのまま符号化されている。予測符号化されている値はc4´、d0´、b12´、o´というように´付きで表示されている。ここでは、予測対象となるフィルタ係数を符号化データの最後におく。また、符号化データ順、すなわち、c4、d0、b12、oの順に復号する。
まず、フィルタセット内フィルタ係数予測部202では、式(5−3´)により、予測画像の中心要素にかかる重み係数c4の予測値は以下の式(52)により得られる。
続いて、式(5−3´)により残差画像の中心要素にかかる重み係数d0の予測値が以下の式(53)により得られる。
続いて、式(5−3)によりNRF後画像の中心要素にかかる重み係数b0の予測値が以下の式(54)により得られる。
最後に、式(5−3´´)によりオフセットoの予測値が以下の式(55)により得られる。
第2の実施形態の適応フィルタ部302´では、予測画像と残差画像とNRF後画像の重み付けを用いて、元々の原画に近い画像を生成する。一般にノイズ低減フィルタであるNRF後画像が、予測画像、残差画像よりも元々の原画に近いことが多い。そのため最大の重み係数は、NRF後画像の中心要素にかかる重み係数bcとなる。
なお、実際の構成では、処理の簡単化のため、NRF後画像の中心要素にかかる重み係数bcだけを予測する。もしくは、NRF後画像の中心要素にかかる重み係数bcとオフセットoのみを予測する構成としても良い。
(種別特定部601´)
第2の実施形態では、種別特定部601の代わりに種別特定部601´を用いる。種別特定部601´は重み係数に対応するインデックスlを入力とし、各インデックスlから重み係数の種別情報を次のように出力する。インデックスlが0からNumPN−1までは予測画像であるので、重み係数の種別情報が予測画像であることを示す種別識別子(ここでは3)を出力する。インデックスlがNumPNからNumPN+NumEN−1までは残差画像にかかる係数であるので、重み係数の種別情報が残差画像であることを示す種別識別子(ここでは4)を出力する。インデックスlがNumPN+NumENからNumPN+NumEN+NumN−1まではNRF後画像にかかる係数であるので、重み係数の種別情報がNRF後画像であることを示す種別識別子(ここでは2)を出力する。インデックスlがNumPN+NumEN+NumNの場合にはオフセットであるので、重み係数の種別情報がオフセットであることを示す種別識別子(ここでは5)を出力する。
(種別寄与率算出部602)
図6は、種別寄与率算出部602で算出される種別寄与率kind_magの値を示す図である。種別寄与率算出部602は種別特定部601´から種別情報を入力し、種別寄与率kind_magを出力する。図6(a)に示すように本実施形態における種別寄与率kind_magは以下のように算出する。
種別がNRF後画像にかかるフィルタ係数もしくは予測画像にかかるフィルタ係数の場合(種別が2もしくは3の場合)
kind_mag=1
種別がそれ以外の場合(種別が4もしくは5の場合)
kind_mag=0
また、この実施形態では入力されないが、仮に、NRF前画像にかかるフィルタ係数(種別識別子は1)が入力された場合には、
種別がNRF後画像にかかるフィルタ係数の場合(種別識別子が1の場合)
kind_mag=1
のように動作する。
ここで、予測画像と残差画像の種別寄与率kind_magは以下のように定められる。予測画像のスライス平均値と、適応フィルタの出力のスライス平均はほぼ等しいと考えられるため、式(6−2)によりNRF前画像にかかるフィルタ係数のkind_magは1と定められる。また、残差画像のスライス平均値は0であると考えられるため、NRF後画像にかかるフィルタ係数のkind_magは0と定められる。
(種別寄与率算出部602´)
図6(b)は、種別寄与率算出部602で算出される種別寄与率kind_magの値の別の例である。この例の動作を行う種別寄与率算出部602´を以下に説明する。
種別寄与率算出部602´では、以下の動作を行う。
種別がNRF前画像にかかるフィルタ係数の場合(種別識別子が1の場合)
kind_mag=1
種別がNRF後画像にかかるフィルタ係数の場合(種別識別子が2の場合)
kind_mag=1
種別が予測画像の場合(種別識別子が3の場合)
kind_mag=0.9
種別が残差画像の場合(種別識別子が4の場合)
kind_mag=0.1
種別がそれ以外の場合(種別識別子が5の場合)
kind_mag=0
予測画像と残差画像の種別寄与率kind_magを上記のように定めた方法について以下説明する。予測画像predと残差画像errorの和が、復号画像であるから、復号画像をSdecと置くと以下の式になる。
Sdec=pred+error (6−2´´)
この式のスライス平均を算出すると
E(Sdec)=E(pred)+E(error) (6−2´)
となる。ここでE(error)=Aと置くと、式(6−2´)より、
E(pred)=E(x)―Aとなる。
これを式(1−2)に代入すると、
E(SALF)≒Σc(E(Sdec)―A)+Σd×A+Σb×E(Snrf)
となる。
ここで両辺をE(SALF)で割り、寄与率mag_c、mag_d、mag_bを用いて表現すると、重み係数和に関する条件が得られる。
Σc×mag_c+Σd×mag_d+Σb×mag_b=1
ここで、
mag_d = E(error)/E(SALF)
mag_c = (E(Sdec)―E(error))/E(SALF)
mag_b = E(Snrf)/E(SALF)
である。
残差画像errorのスライス平均は、フィルタ後画像(SALF)のスライス平均に比べて十分に小さいと考えられるので、ここでは
mag_d = 0.1
とした。
この場合、E(Sdec)とE(SALF)はほぼ等しいと考えられるため、
mag_c = (E(Sdec)/E(SALF)―E(error))/E(SALF)
= 1 − mag_d
により、
mag_c = 0.9
とすることができる。
なお、他にAとしては0.5以下の値を用いることができ、この場合、以下のように寄与率を定める。
mag_d = A
mag_c = 1−A
(フィルタ係数予測部503の別の構成)
フィルタ係数予測部503の別の構成について以下で説明する。予測対象とする寄与率が小さい場合もしくは0である場合には、上記では、残差画像の重み係数を求める場合には、(式5−3´)を用いても精度が十分ではない可能性がある。この場合には、別の性質に基づいた推定を行う構成が考えられる。
この構成では、既に復号されている予測画像の重み係数を用いて、残差画像にかかる重み係数を予測する。すなわち、
残差画像の重み係数の予測値 = 予測画像の重み係数 (5−3´´´)
により予測を行う。重み係数が複数のタップ数から構成されている場合には、対応する位置毎に予測を行う。例えば、残差画像の重み係数の中心要素は、予測画像の重み係数の中心要素から予測する。対応する位置がない場合には0を予測値とする。
この性質は、式(6−2´´)に基づいて求められたものである。すなわち、予測画像と残差画像の和が復号画像であることから、復号画像に近い値である原画に近い値を重み付けで得るためには、予測画像と残差画像の重み係数が等しい必要がある。この必要に基づいて、式(5−3´´´)が定められている。
なお、以下の式(5―3´´´´)を用いて、予測画像にかかる重み係数を予測しても構わない。
予測画像の重み係数の予測値 = 残差画像の重み係数 (5−3´´´´)
(動画像符号化装置2´)
続いて、本発明を適用した画像符号化装置について、図を参照して説明する。
図16は、動画像符号化装置2´の構成を示すブロック図である。動画像符号化装置1と同様の部材に関しては、同一の符号を付し、その説明を省略する。
図16に示すように、動画像符号化装置2´は、予測部111と、変換部112と、量子化部113と、可変長符号化部114と、逆量子化部115と、逆変換部116と、フレームメモリ117と、適応フィルタ情報算出部118´と適応フィルタ情報保存部119とループフィルタ部120´、フィルタ係数予測符号化部211、と減算部107と加算部109とから構成される。予測部111、変換部112、量子化部113、可変長符号化部114、逆量子化部115、逆変換部116、フレームメモリ117、適応フィルタ情報保存部119、ループフィルタ部120´、フィルタ係数予測符号化部211、減算部107、加算部109は、第1の実施形態における動画像符号化装置1および第2の実施形態における動画像復号装置1´と同じ動作であるので説明を省略する。
(適応フィルタ情報算出部118´)
以下、適応フィルタ情報算出部118´の動作を説明する。適応フィルタ情報算出部118´は、入力画像Sorgと予測画像pred、残差画像error、NRF後画像Snrfから、以下の式(8−1´)を最小化する重み係数cf(k=0〜NumPN−1)とdf(k=0〜NumEN−1)とbf(k=0〜NumN−1)、オフセットofの推定値を最小二乗法により求める。ここでfはfloatの略であり、最小二乗法では小数点数として重み係数を算出することを意味する。
ここで、一次元インデックスkとu、vの関係は既に動画像符号化装置2の説明で示したとおりである。
最小二乗法に先立ち、式(8−1´)を重み係数cfとdf、bf、オフセットofをパラメータとする以下の式(8−2´)に直す。
最小二乗法においては、式(8−2´)をパラメータcf、df、bf、ofの式とみなして、各々のパラメータに対して偏微分を行い、これを0とする。これによって、正規方程式と呼ばれるパラメータの数NumPN+NumEN+NumN+1個の連立方程式が得られる。
得られた方程式をガウスの消去法などによって解くことにより、cfの最適推定値cfeと、dfの最適推定値dfe、bfの最適推定値bfe、ofの最適推定値ofeが得られる。これらを重み係数の組を推定値zfeと呼ぶ。
最小二乗法の演算は、事前にタップ数PN、EN、及びNを特定の値に定めて行われる。但し、最適なPN、EN、Nの組み合わせを予め定めることは困難であることから、可能な全ての組み合わせに対して最小二乗法を行い、最適なPN、EN、Nの組み合わせを二乗誤差最小やRDコスト最小などの条件に基づいて選択することで、最適化を行う。
また、以上説明したそれぞれの実施形態において、動画像復号装置および動画像復号装置の各機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することにより動画像復号装置や動画像復号装置の制御を行っても良い。なお、ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに、「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含むものとする。また上記プログラムは、前述した機能の一部を実現するためのものであっても良く、さらに、前述した機能をコンピュータシステムに既に記録されているプログラムとの組み合わせで実現できるものであっても良い。
以上、この発明の実施形態について図面を参照して詳述してきたが、具体的な構成はこの実施形態に限られるものではなく、この発明の要旨を逸脱しない範囲の設計等も特許請求の範囲に含まれる。
1…動画像復号装置、1´…動画像復号装置、2…動画像符号化装置、2´…動画像符号化装置、107…減算部、109…加算部、111…予測部、112…変換部、113…量子化部、114…可変長符号化部、115…逆量子化部、116…逆変換部、117…フレームメモリ、118…適応フィルタ情報算出部、118´…適応フィルタ情報算出部、119…適応フィルタ情報保存部、120…ループフィルタ部、120´…ループフィルタ部、201…フィルタ係数予測復号部、201´…フィルタ係数予測復号部、202…フィルタセット内フィルタ係数予測部、203…フィルタセット間フィルタ係数予測部、204…予測方式切替部、205…加算部、206…減算部、211…フィルタ係数予測符号化部、301…NRF部、302…適応フィルタ部、302´…適応フィルタ部、401…境界エッジ算出部、402…活性度算出部、403…NRF画素生成部、501…予測対象係数特定部、502…重み係数和算出部、503…フィルタ係数予測部、505…寄与率算出部、506…対応フィルタ係数参照部、601…種別特定部、602…種別寄与率算出部、603…参照信号数算出部、604…乗算部、701…復号画像適応重み付け部、702…NRF後画像適応重み付け部、703…シフト/除算部、704…予測画像適応重み付け部、705…残差画像適応重み付け部

Claims (14)

  1. 複数種別の信号を入力が可能な適応フィルタを備える動画像復号装置であって、符号化データからフィルタ係数の可変長符号復号を行う可変長符号復号部と、復号済みのフィルタ係数を用いて、復号対象のフィルタ係数の予測値を算出するフィルタ係数予測部とを備える動画像復号装置であって、さらに、前記フィルタ係数予測部は、フィルタ係数毎に定まる寄与率とフィルタ係数との積和によって算出される重み係数和を算出する重み係数和算出手段を備えることを特徴とする動画像復号装置。
  2. 前記重み係数和算出手段で用いられる寄与率は、フィルタ係数がかかる信号の種別に応じて定まる種別寄与率と、フィルタ係数がかかる信号の数である参照信号数の積で算出される値であることを特徴とする請求項1に記載の動画像復号装置。
  3. 前記動画像復号装置のフィルタ係数予測部では、適応フィルタのフィルタ係数の一つであるオフセットを予測することを特徴とする請求項1から2に記載の動画像復号装置。
  4. 前記動画像復号装置は、ノイズ低減フィルタ手段を備え、ノイズ低減フィルタ手段の出力を適応フィルタの入力の一つとすることが可能な動画像復号装置であって、フィルタ係数予測部では、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数を予測することを特徴とする請求項1から3に記載の動画像復号装置。
  5. 前記動画像復号装置は、復号画像とノイズ低減フィルタ手段の出力を適応フィルタの入力とすることが可能な動画像復号装置であって、フィルタ係数予測部では、復号画像の中心要素にかかるフィルタ係数とNRF後画像の中心要素にかかるフィルタ係数を予測することを特徴とする請求項1から4に記載の動画像復号装置
  6. 前記動画像復号装置は、フィルタ予測部として、さらにフィルタ係数予測部は、過去に復号したフィルタセットに含まれるフィルタ係数を用いてフィルタ係数の予測を行うフィルタセット間予測部と、同一フィルタセット内で既に復号したフィルタ係数を用いてフィルタ係数の予測を行うフィルタセット内予測部を備え、さらに、ノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数をフィルタセット内予測部を用いて予測し、それ以外のフィルタ係数の予測をフィルタセット間予測部を用いて予測することを特徴とする請求項5に記載の動画像復号装置。
  7. 前記動画像復号装置は、予測画像と残差画像とノイズ低減フィルタ手段の出力を適応フィルタの入力とすることが可能な動画像復号装置であって、さらにノイズ低減フィルタ手段の出力であるNRF後画像の中心要素にかかるフィルタ係数を予測するフィルタ係数予測部を備えることを特徴とする請求項1から4に記載の動画像復号装置。
  8. 前記動画像復号装置において、適応フィルタの入力信号の種別に対する寄与率を算出する寄与率算出部では、復号画像に対する寄与率を1、ノイズ低減フィルタ後画像に対する寄与率を1とすることを特徴とする請求項5から6に記載の動画像復号装置。
  9. 前記動画像復号装置において、適応フィルタの入力信号の種別に対する寄与率を算出する寄与率算出部では、予測画像に対する寄与率を1、残差画像に対する寄与率を0、NRF後画像に対する寄与率を1とすることを特徴とする請求項7に記載の動画像復号装置。
  10. 前記動画像復号装置において、適応フィルタの入力信号の種別に対する寄与率を算出する寄与率算出部では、0.5以下の所定の値Aに対し、予測画像に対する寄与率を1−A、残差画像に対する寄与率をA、NRF後画像に対する寄与率を1とすることを特徴とする請求項7に記載の動画像復号装置。
  11. 複数種別の信号を入力が可能な適応フィルタを備える動画像符号化装置であって、予測対象以外のフィルタ係数を用いて、予測対象のフィルタ係数の予測値を算出するフィルタ係数予測部とを備える動画像符号化装置であって、さらに、前記フィルタ係数予測部は、フィルタ係数毎に定まる寄与率とフィルタ係数との積和によって算出される重み係数和を算出する重み係数和算出手段を備えることを特徴とする動画像符号化装置。
  12. 少なくともオフセットを含む適応フィルタ情報を含む符号化データであって、前記符号化データ中に符号化されたオフセットが、前記オフセット以外のフィルタ係数から算出された重み係数和を用いて予測された差分値であることを特徴とする符号化データ。
  13. 復号画像にかかるフィルタ係数と、NRF後画像にかかるフィルタ係数とを含む、フィルタ係数セットを含む適応フィルタ情報を含む符号化データであって、少なくともNRF後画像の中心要素にかかるフィルタ係数が、NRF後画像の中心要素にかかるフィルタ係数以外から算出された重み係数和を用いて予測された差分値であることを特徴とする符号化データ。
  14. 予測画像にかかるフィルタ係数と、残差画像にかかるフィルタ係数と、NRF後画像にかかるフィルタ係数とを含む、フィルタ係数セットを含む適応フィルタ情報を含む符号化データであって、少なくともNRF後画像の中心要素にかかるフィルタ係数が、NRF後画像の中心要素にかかるフィルタ係数以外から算出された重み係数和を用いて予測された差分値であることを特徴とする符号化データ。
JP2010160730A 2010-07-15 2010-07-15 動画像符号化装置および動画像復号装置および符号化データ構造 Pending JP2013201467A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2010160730A JP2013201467A (ja) 2010-07-15 2010-07-15 動画像符号化装置および動画像復号装置および符号化データ構造
PCT/JP2011/066020 WO2012008506A1 (ja) 2010-07-15 2011-07-13 画像フィルタ装置、復号装置、動画像復号装置、符号化装置、動画像符号化装置、および、データ構造

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010160730A JP2013201467A (ja) 2010-07-15 2010-07-15 動画像符号化装置および動画像復号装置および符号化データ構造

Publications (1)

Publication Number Publication Date
JP2013201467A true JP2013201467A (ja) 2013-10-03

Family

ID=49521381

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010160730A Pending JP2013201467A (ja) 2010-07-15 2010-07-15 動画像符号化装置および動画像復号装置および符号化データ構造

Country Status (1)

Country Link
JP (1) JP2013201467A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018168484A1 (ja) * 2017-03-15 2018-09-20 ソニー株式会社 符号化装置、符号化方法、復号装置、及び、復号方法
JP2020522175A (ja) * 2017-05-26 2020-07-27 エーティーアイ・テクノロジーズ・ユーエルシーAti Technologies Ulc 高品質なビデオ再生用のアプリケーション固有のフィルタ
CN114190886A (zh) * 2020-09-18 2022-03-18 卡西欧计算机株式会社 噪声波形除去装置及方法、模型训练装置及方法、生成模型以及可穿戴设备

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018168484A1 (ja) * 2017-03-15 2018-09-20 ソニー株式会社 符号化装置、符号化方法、復号装置、及び、復号方法
JP2020522175A (ja) * 2017-05-26 2020-07-27 エーティーアイ・テクノロジーズ・ユーエルシーAti Technologies Ulc 高品質なビデオ再生用のアプリケーション固有のフィルタ
CN114190886A (zh) * 2020-09-18 2022-03-18 卡西欧计算机株式会社 噪声波形除去装置及方法、模型训练装置及方法、生成模型以及可穿戴设备
JP2022051378A (ja) * 2020-09-18 2022-03-31 カシオ計算機株式会社 ノイズ波形除去装置、モデル訓練装置、ノイズ波形除去方法、モデル訓練方法、生成モデル及びウェアラブル機器
JP7342827B2 (ja) 2020-09-18 2023-09-12 カシオ計算機株式会社 ノイズ波形除去装置、モデル訓練装置、ノイズ波形除去方法、モデル訓練方法、及びウェアラブル機器
CN114190886B (zh) * 2020-09-18 2024-01-19 卡西欧计算机株式会社 噪声波形除去装置及方法、模型训练装置及方法、以及可穿戴设备

Similar Documents

Publication Publication Date Title
JP6615290B2 (ja) ビデオ符号化方法、ビデオ復号方法、ビデオエンコーダ、及びビデオデコーダ
JP6660074B2 (ja) 映像復号化方法及び装置
JP6335365B2 (ja) 復号装置
RU2696311C1 (ru) Устройство и способ для компенсации движения видео с выбираемым интерполяционным фильтром
JP5750579B2 (ja) イントラ予測モード復号化方法及び装置
KR102359415B1 (ko) 비디오 코딩을 위한 인터 예측 장치 및 방법을 위한 보간 필터
KR20220013941A (ko) 행렬 기반 인트라 예측
KR20140064972A (ko) 화상 부호화 및 복호 방법, 장치, 프로그램
WO2012173109A1 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、動画像復号方法、動画像符号化プログラム及び動画像復号プログラム
JP2012142886A (ja) 画像符号化装置及び画像復号装置
JP2013201467A (ja) 動画像符号化装置および動画像復号装置および符号化データ構造
WO2011105231A1 (ja) フィルタ係数符号化装置、フィルタ係数復号装置、動画像符号化装置、動画像復号装置、および、データ構造
KR102435316B1 (ko) 이미지 처리 장치 및 방법
WO2013145174A1 (ja) 動画像符号化方法、動画像復号方法、動画像符号化装置及び動画像復号装置
WO2011105230A1 (ja) フィルタ係数符号化装置、フィルタ係数復号装置、動画像符号化装置、動画像復号装置、および、データ構造
JP2008066911A (ja) 映像符号化方法、映像符号化装置、映像符号化プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
JP6012307B2 (ja) 動画像符号化装置及びその制御方法、並びに、プログラム