JP2010166145A - 動画像復号装置 - Google Patents

動画像復号装置 Download PDF

Info

Publication number
JP2010166145A
JP2010166145A JP2009004844A JP2009004844A JP2010166145A JP 2010166145 A JP2010166145 A JP 2010166145A JP 2009004844 A JP2009004844 A JP 2009004844A JP 2009004844 A JP2009004844 A JP 2009004844A JP 2010166145 A JP2010166145 A JP 2010166145A
Authority
JP
Japan
Prior art keywords
unit
distribution model
distribution
frequency
decoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2009004844A
Other languages
English (en)
Inventor
Ryoji Hashimoto
亮司 橋本
Takao Onoe
孝雄 尾上
Hiroshi Tsutsui
弘 筒井
Tomohiro Igai
知宏 猪飼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Osaka University NUC
Sharp Corp
Original Assignee
Osaka University NUC
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Osaka University NUC, Sharp Corp filed Critical Osaka University NUC
Priority to JP2009004844A priority Critical patent/JP2010166145A/ja
Publication of JP2010166145A publication Critical patent/JP2010166145A/ja
Pending legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】予測画像の差分画像の分布モデルを推定し、推定した分布モデルを用いて、ビット尤度を算出し、付加的情報利用復号の性能を向上する動画像復号装置を提供する。
【解決手段】動画像復号装置100は、イントラ復号部101、変換部102、量子化部103、付加的情報利用復号部104、再構成部105、逆変換部106、フレームメモリ107、予測画像生成部108、差分算出部151、変換部152、分布モデル推定部153、ビット尤度推定部154から構成され、予測画像の生成に用いた予測画像の差分画像をDCT変換し、変換した変換係数から分布モデルを推定し、推定した分布モデルを用いて、ビット尤度を算出し、付加的情報利用復号に供する。
【選択図】図1

Description

本発明は、動画像符号化装置により符号化された動画像の復号を行う動画像復号装置に関する。
<予測符号化の説明>
従来から、動画像符号化方式として、MPEG(Moving Picture Experts Group)やH.26xシリーズなどの方式が知られている。これらの方式では、動き補償技術を用いて符号化対象画像の予測画像を生成し、符号化対象画像と予測画像の差分を符号化することによって動画像を符号化する。このような符号化方式は予測符号化方式と呼ばれる。
以下、予測符号化を行う装置及びその復号を行う装置の一般的な構成を説明する。今、Xを符号化対象信号、YをXの予測信号、NをXとYの予測誤差とすると、
X=Y+N
である。予測符号化の符号化装置では、予測信号Yを生成し予測誤差N(=X−Y)を算出した上で、予測信号Yを生成するための情報と予測誤差Nを符号化する。
復号装置では、まず予測信号を生成するための情報から予測信号Yを復号し、さらに予測誤差Nを復号する。続いて、得られた予測信号Yと予測誤差Nを下式のように加算することで、符号化対象信号Xを復号する。
X=Y+N
<Distributed Video Codingの説明>
ところで、近年、新しい動画像符号化方式としてDistributed VideoCoding(以下、DVC符号化と称する)と呼ばれる符号化方式が知られるようになった(例えば、非特許文献1及び特許文献1を参照)。DVC符号化は、誤り訂正技術を用いると、一定の誤りのある符号を訂正することが可能であるという原理を利用したものである。
以下、DVC符号化を行う装置及びその復号を行う装置の一般的な構成を説明する。予測符号化の説明と同様、符号化対象信号をX、Xの予測信号をY、XとYの予測誤差をNとすると、
X=Y+N
である。
DVC符号化の符号化装置では、予測信号Yの生成を行わず、復号装置で予測信号Yを生成する。DVC符号化の特徴は、符号化装置で予測信号Yを生成しない分、符号化に必要な演算量が小さいことである。符号化装置では、予測信号Yを生成しないことから、予測誤差Nを求めることはできない。そこでDVC符号化では、予測誤差Nを符号化する代わりに、符号化対象信号Xの誤り訂正用の情報を符号化する。
誤り訂正用の情報としては、一般の誤り訂正符号が利用できる。誤り訂正符号には、畳み込み符号、ターボ符号、低密度パリティ検出符号などがあるが、DVC符号化にはそのいずれもが利用可能である。DVC符号化では誤り訂正用の情報を圧縮に使うが、その使い方は、伝送や蓄積など通常の誤り訂正符号の使い方とは異なる。
誤り訂正符号の通常の使い方(例えば信号Xの伝送)では、誤り訂正符号化により信号XのパリティWZを生成した後、元の信号XとパリティWZの両者を伝送する。受信側では、信号XとパリティWZの組を受け取り、それらの組から誤りを訂正することで誤りのない信号Xが得られる。
それに対し、DVC符号化では、信号Xを圧縮対象とすると、信号XのパリティWZを生成後、信号X自体は破棄し、パリティWZのみを伝送する。一般に、パリティWZは、信号Xよりも情報量が小さいため、信号XをパリティWZに置き換えることで符号量を削減できる。
DVC符号化の手順を式で記述すると、
WZ=パリティ生成(X)
である。
DVC符号化の復号装置では、まず、DVC符号化による符号化データとは異なる、復号装置に入力される情報(例えば前後のフレームから予測した動きベクトルなど)を用いて、信号Xの予測値(予測信号Y)を生成する。予測信号Yは、Xに誤りNが載った信号とみなすことができることから、パリティWZを用いて予測信号Yの誤りを訂正することで、Xを再生することができる。
DVC符号化の復号の手順を式で記述すると、
X=誤り訂正(Y,WZ)
である。
<DVC符号化のための装置の具体的な構成の説明>
以下、具体的なDVC符号化に関する装置の構成を説明する。図17は、従来のDVC符号化を用いた動画像符号化装置及び動画像復号装置を示すブロック図である。動画像符号化装置500は、イントラ符号化部501、変換部502、量子化部503、付加的情報生成部504、及びフレーム振り分け部505から構成される。動画像復号装置600は、イントラ復号部601、変換部602、量子化部603、付加的情報利用復号部604、再構成部605、逆変換部606、フレームメモリ607、予測画像生成部608、から構成される。
<DVC符号化の動画像符号化装置の動作説明>
動画像符号化装置500に入力された符号化対象フレームはフレーム振り分け部505によって、キーフレームとキーフレーム以外(以下、WZフレームと呼ぶ)に振り分けられる。キーフレームは、イントラ符号化部501においてフレーム内符号化方式により符号化される。WZフレームは、空間的冗長性を削減するためDCT変換などを行う変換部502で変換され、量子化部503で量子化された後、付加的情報生成部504で付加的情報が生成される。この付加的情報がWZフレームの符号化データである。キーフレームは、WZフレームの予測を可能にするために必要なものであり、数フレームに1枚の割合で符号化される。ここで、最初のWZフレームを符号化する前には複数枚(2枚以上)のキーフレームを符号化する。このように動画像符号化装置500では、符号化の結果としてキーフレームの符号化データとWZフレームの符号化データが生成され、外部へ出力されるか記憶部(図示せず)に蓄積される。なお、DCT変換を行う変換部502を備えず、画素領域のまま、量子化し誤り訂正符号などの付加的情報を生成する構成の符号化装置も存在する。
<DVC符号化の動画像復号装置の動作説明>
動画像復号装置600では、まず、キーフレームの符号化データを受信し、その符号化データからイントラ復号部601によりキーフレームが復号される。復号されたキーフレームはフレームメモリ607に格納される。続いて、動画像復号装置600は、WZフレームの符号化データを受信する。WZフレームの符号化データを受信すると、まず、フレームメモリ607に格納されたフレームを参照フレームとして予測画像が生成される。
予測画像の生成について説明する。WZフレームを復号する時点では、フレームメモリ607には少なくとも複数枚の参照フレームが存在している(最初のWZフレームを復号する時点においてもすでに複数枚のキーフレームが復号されフレームメモリ607に格納されている)。予測画像生成部608では、1)参照フレーム間の動きを探索し、2)参照フレームと復号対象フレームの間隔に基づいて、動きの内挿もしくは外挿により、復号対象フレームと参照フレーム間の動きを推定し、3)推定された動きにより、参照フレームを用いて復号対象画像を予測する。以上の流れで予測画像を生成することができる。
生成された予測画像は変換部602でDCT変換などの変換がなされる。予測画像の変換係数は、一方では量子化部603に入力され、他方では再構成部605に入力される。量子化部603では、予測画像の変換係数が量子化される。予測画像の変換係数を予測信号、量子化された予測信号を量子化予測信号と呼ぶ。付加的情報利用復号部604では、符号化装置より伝送された付加的情報WZを用いて、量子化後の変換係数の誤りが訂正される。誤り訂正された変換係数は再構成部605に入力される。なお、符号化装置500と同様、変換部602を備えない構成も存在する。
再構成部605では逆量子化を行う。再構成部605の逆量子化では、予測信号(ここでは、予測画像の変換係数)を用いることによって確率的に符号化対象画像の信号に近くなるように処理する。この処理は、DVC符号化では一般的な方法である(例えば、非特許文献2を参照)。従来の逆量子化を行う手段と区別するため、本明細書では、予測信号を用いない従来の逆量子化を行う手段を有する部位を逆量子化部と呼び、予測信号を用いた逆量子化を行う手段を有する部位を再構成部と呼ぶ。
図18は、通常の逆量子化及び予測信号を用いた逆量子化の方法を説明するための図である。ここで、図18(a),(b)は、図17の再構成部605での逆量子化、すなわち予測信号Yを用いた逆量子化の方法を説明するための図で、図18(c)は、図18(a),(b)との比較のために、予測信号Yを用いない逆量子化を説明するための図である。量子化とは、ある値の範囲(複数の値)に対して1つの値(量子化代表値)を割り当てる処理であるから、量子化代表値となる量子化前の値は複数ある(範囲をとる)。例えば、−2、−1、0、1、2に0を割り当てるような量子化の場合には、量子化により0となる量子化前の値は、この場合−2、−1、0、1、2の範囲となる。
通常の逆量子化(予測信号Yを用いない逆量子化)では、図18(c)に示すように、量子化前の値の範囲内の1つの値を量子化代表値とし、量子化された値から量子化代表値を得ることで逆量子化が行われる。前の例では、−2、−1、0、1、2のうちの1つの値として0を量子化代表値とする(0の逆量子化では0が得られる)。
それに対し、予測信号を用いた逆量子化は、量子化された値から決まる1つの量子化代表値を用いるのではなく、予測信号が量子化前の範囲にあるかどうかで値を変える。具体的には、図18(a)に示すように、予測信号が量子化前の係数の値の範囲にあれば、予測信号をそのまま用いる。逆に、図18(b)に示すように、予測信号が量子化前の係数の範囲外であれば、量子化前の係数の範囲内の値のうち予測信号に最も近い値を用いる。このような処理によって、単純に量子化代表値を用いるよりも、確率的に元の値に近い値を求めることができる。
再構成部605により逆量子化された変換係数は、逆変換部606において逆変換がなされ画像が復号される。復号画像は、出力画像として出力されると共に、フレームメモリ607に格納される。フレームメモリ607に格納された画像は、後続のフレームにおいて、復号対象ブロックの予測画像の生成に用いることができる。
フレームメモリ607に格納された画像は外部に出力できる。勿論、外部出力の代わりに、図示しない記憶部へ出力(つまり蓄積)してもよい。
このように、符号化装置では予測信号の生成を行わずに復号装置で予測信号の生成を行うDVC符号化では、予測信号を用いた逆量子化(再構成)を行うことで復号画像の画質を向上させる処理が広く用いられている。
また、非特許文献3は、DCT変換を行う変換部を持たない構成のDVC符号化データの復号方法が開示されている。非特許文献3の復号方法においては、付加的情報復号において、誤り訂正後の信号が0であるか1であるかの確率(ビット尤度)を、予測誤差の分布モデル(具体的にはラプラス分布)の確率密度関数を用いて求め、分布モデルの確率密度関数のパラメータ(分布パラメータ)を、予測画像を生成する際に得られる2つの動き補償信号の差の分散を用いて推定する方法が開示されている。
以下、量子化の影響を省いて簡潔に説明する。予測信号YとパリティWZから誤り訂正により復号信号Xを得る復号装置の処理は、
X=誤り訂正(予測信号Y、パリティWZ)
であり、XとYは以下の関係がある。
X=予測信号Y+予測誤差N
この関係において、非特許文献は、予測誤差Nの分布(=予測誤差特性)を推定することにより、Xの信号の値の分布を得る方法である。
この方法では、復号装置で予測誤差特性を推定するため、符号化時にあらかじめ予測誤差特性を決定しておく方法に比べ、時間的・空間的に予測誤差特性が変化する場合において、誤り訂正の効率を高めることができる。
特開2007−274035号公報
高村誠之、「Distributed Video Codingの動向と今後」、情報処理学会研究報告2006−AVM−54 A.Aaron,R.Zhang and B.Girod,"Wyner−Ziv coding of motion video," Proc. Asilomar Conference on Signals and Systems,Pacific Grove,CA,Nov.2002 C.Briteds,J.Ascenso,F.Pereira"Studying Temporal Correlation Noise Modeling for Pixel Based Wyner−Ziv Video Coing,"in Proc.ICIP 2006.
しかし、非特許文献3で示される従来技術では、DCT変換を行う変換部を持たない構成であるため、予測画像をDCT変換し空間的冗長性を除去するような構成においては、復号側で予測誤差特性を推定する方法を用いることができないという課題があった。
また、変換部を備える構成であっても、予測画像の変換係数である予測信号の特性が、時間的、空間的だけでなく周波数によっても異なる(変化する)ため、この変化に応じたビット尤度を算出することができない。
また、予測誤差特性の分布モデルとしてラプラス分布を用いているが、予測誤差分布の確率密度関数のグラフで、ピークからみて確率密度の減衰率が大きい状態が比較的長い裾野で続く場合(以下、尖ったピーク付近を持つ場合)には、正確に予測誤差分布をモデル化することができない。
このように、変換部を備える動画像符号化装置において、時間的に変動する特性に応じて、また、周波数により異なる特性に応じて、また、尖ったピーク付近を持つ特性に対応して、予測誤差特性を推定できないために、誤り訂正能力を高くすることができない。DVC符号化における符号化効率は、その動画像復号装置の能力に依存するため従来技術では、符号化効率の高いDVC符号化を行うことは困難である。
そこで、本発明は、斯かる実情に鑑み、付加的情報利用復号の性能を向上し、ひいては、DVC符号化効率を向上する動画像復号装置を提供するものである。
上記のような問題点を解決するために、本発明に係る動画像復号装置は、以下のような構成とし、特徴を有する。
上記課題を解決する本発明の動画像復号装置は、復号した画像を蓄積するフレームメモリと、前記フレームメモリに蓄積された画像から、2つの動き補償画像を生成し、生成された動き補償画像の線形和によって、復号対象となる画像の予測画像を生成する予測画像生成部と、前記予測画像を周波数変換し、予測信号を生成する第1の変換部と、前記第1の変換部により生成された前記予測信号の変換係数を量子化する量子化部と、量子化された前記変換係数を、動画像符号化装置より伝送された付加的情報を用いて、復号する付加的情報利用復号部と、前記予測画像生成部で生成された2つの動き補償画像の差分画像を算出する差分算出部と、前記差分画像を周波数変換する第2の変換部と、前記第2の変換部により周波数変換された変換係数の差分特徴量を抽出する特徴量抽出部と、抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する分布モデル推定部と、推定された差分分布モデルから復号信号分布モデルを算出し、該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが0か1かの確率を示すビット尤度を推定するビット尤度推定部と、を備え、前記付加的情報利用復号部は、前記ビット尤度推定部で推定された前記ビット尤度を用いて、復号処理を行うことを特徴とする。
また、本発明の動画像復号装置において、前記分布モデル推定部は、抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する代わりに、前記差分特徴量と前記予測信号と用いて、直接、復号信号分布モデルを算出し、前記ビット尤度推定部は、算出された該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが0か1かの確率を示すビット尤度を推定するようにしたことを特徴とする。
また、本発明の動画像復号装置において、前記分布モデル推定部は、コーシー分布とラプラス分布を含む複数の分布モデルから、推定対象とする分布モデルを選択する分布モデル選択部を備え、前記特徴量抽出部は、前記選択された分布モデルに応じた前記変換係数の差分特徴量を抽出することを特徴とする。
また、本発明の動画像復号装置において、前記特徴量抽出部は、頻度算出部と、該頻度算出部で算出された頻度データを用いて少なくとも最頻値頻度を含む頻度を抽出する頻度抽出部と、を備え、前記分布モデル推定部は、分布モデルがコーシー分布である場合、前記頻度抽出部により抽出された前記頻度に基づいて、該コーシー分布のモデルパラメータを算出することを特徴とする。
本発明に係る動画像復号装置によれば、以下に示す優れた効果を奏し得る。
上記のように構成された本発明の動画像復号装置によれば、予測画像の生成に用いた予測画像の差分をDCT変換し、変換した変換係数から分布モデルを推定し、推定した分布モデルを用いて、予測画像の変換係数である予測信号の特性が、時間的、空間的、周波数的変化に応じたビット尤度を算出し、このビット尤度を用いて、付加的情報利用復号するため、付加的情報利用復号性能を向上することができ、ひいては符号化効率を向上することができる。
また、本発明の動画像復号装置によれば、分布モデル選択部を設けることによって、種々の分布モデルから適切な分布モデルを選択し、推定し選択することができる。
また、本発明の動画像復号装置によれば、予測誤差分布の確率密度関数のグラフが尖ったピーク付近を持つ特性に対応して、予測誤差特性を推定することができ、誤り訂正能力を高くすることができる。
第1の実施形態に係る動画像復号装置の構成例を示すブロック図である。 本実施形態に係る分布モデル推定部153の構成例を示すブロック図である。 本実施形態に係る特徴量抽出部202の構成例を示すブロック図である。 本実施形態に係るビット尤度推定部154の構成例を示すブロック図である。 本実施形態に係る値集合算出部402の動作を説明するための模式図である。 本実施形態に係る逆量子化値集合算出部403の動作を説明するための模式図である。 本実施形態に係る頻度算出部303の動作を示すフロー図である。 本実施形態に係るビット尤度推定部154におけるビット尤度の算出方法を説明するための模式図である。 本実施形態に係る量子化予測信号の構成を示す図である。 キーフレームとWZフレームの関係を示す図である。 第2の実施形態に係る動画像復号装置の構成例を示すブロック図である。 第2の実施形態に係る分布モデル推定部の構成例を示すブロック図である。 第3の実施形態に係る動画像復号装置の構成例を示すブロック図である。 第3の実施形態に係るビット尤度評価部の構成例を示すブロック図である。 第3の実施形態に係るクラスタリング部の動作を説明する説明図である。 第3の実施形態に係る推定誤り率EstRwliと測定誤り率RealRwliを示す図である。 従来のDVC符号化を用いた動画像符号化装置及び動画像復号装置を示すブロック図である。 通常の逆量子化及び予測信号を用いた逆量子化の方法を説明するための図である。
以下、本発明に係る動画像復号装置の実施形態について図面を参照して説明する。
図1〜図16は、本発明の実施形態の一例であって、図中、図と同一の符号を付した部分は同一物を表わす。
<第1の実施形態の説明>
図1は、本発明の第1の実施形態に係る動画像復号装置の構成例を示すブロック図である。
図1で例示する動画像復号装置100は、イントラ復号部101、変換部102、量子化部103、付加的情報利用復号部104、再構成部105、逆変換部106、フレームメモリ107、予測画像生成部108、差分算出部151、変換部152、分布モデル推定部153、ビット尤度推定部154から構成される。
動画像復号装置100では、まずキーフレームの符号化データをイントラ復号部101で復号することでキーフレームが復号される。最初のWZフレームを復号する時点までに複数枚のキーフレームが復号される。なお、イントラ復号部101へ入力されるキーフレームの符号化データとキーフレーム以外の符号化データとが多重化されたデータとして入力画像を受信した場合には、入力画像から両者を分離すればよい。イントラ復号部101で復号されたキーフレームは、フレームメモリ107に格納される。
続いて、動画像復号装置100は、WZフレームの符号化データを受信する。WZフレームとして符号化されたフレームは、ブロック単位で復号される。本実施形態では、ブロックサイズを4×4とする。
復号対象ブロックの符号は、付加的情報利用復号部104に入力される。続いて、予測画像生成部108により、フレームメモリ107に格納されたフレームを用いて予測画像(DVCブロックに対する予測画像)が生成される。例えば、図10は、キーフレームとWZフレームの関係を示したものである。図10では、WZフレームとしてWZ1を復号する場合には、K1、K2のキーフレームが復号されている。このとき、フレームメモリ107に記録されたK1、K2の参照フレームを用いて以下のように予測画像を生成する。
まず、1)参照フレーム間の動きを探索する。ここではK1、K2間の動きベクトルをブロック単位で算出する。この例では、動きベクトルMV0で示される動きが検出されたとする。次に、2)参照フレームと復号対象フレームの間隔に基づいて、動きの内挿もしくは外挿により、復号対象フレームと参照フレーム間の動きを推定する。ここでは、K1、K2間の動きベクトルMV0の1/3をK1とWZ1間の動きベクトルMV1とし、K1、K2間の動きベクトルMV0の2/3をK2とWZ1間の動きベクトルMV2とする。最後に、3)動き補償により、推定された動きを用いて復号対象ブロックの予測画像を参照フレームから推定する。ここでは動きベクトルMV1によりK1から生成した画像Y1と、動きベクトルMV2によりK2から生成した画像Y2の平均を(Y1+Y2)/2を予測画像とする。
生成された予測画像は、変換部102で変換される。本実施形態では4×4の2次元DCT変換を用いる。予測画像の変換係数(この値は以後、予測信号として扱われる)は、一方では量子化部103に入力され、他方では再構成部105に入力される。量子化部103では、予測画像の変換係数が量子化される。付加的情報利用復号部104では、動画像符号化装置より伝送された付加的情報WZを用いて、量子化部103の出力の量子化された変換係数(=量子化予測信号)の誤り訂正などにより、変換係数の復号が行われる。なお、付加的情報が誤り訂正符号の場合、付加的情報利用復号部104は誤り訂正部となる。復号された変換係数は、再構成部105に入力される。
誤り訂正に用いられる誤り訂正符号としては、畳み込み符号、リードソロモン符号、ターボ符号、低密度パリティ検出符号などを用いることができる。
再構成部105では、予測信号(DVCブロックの復号時に予測画像生成部108で生成し変換した予測画像)を用いた逆量子化を行う。再構成部105の逆量子化では、予測信号を用いることによって確率的に符号化対象画像の信号に近くなるように処理する。この処理は、図14を用いてすでに説明したものであり、量子化代表値よりも確率的に元の値に近い値を求めるものである。図14(a)に示すように予測信号(予測画像の変換係数)が量子化前の係数の範囲の中にあれば、予測信号を用いる。逆に、図14(b)に示すように予測信号が量子化前の係数の範囲外であれば、範囲の端の値で、予測信号に近い方の値を用いる。
(付加的情報利用復号部104の説明)
付加的情報利用復号部104の入力は、付加的情報と、量子化予測信号である。図9は、量子化予測信号の構成を示す図である。量子化予測信号は、ブロック単位に予測画像を変換、量子化して得られた変換係数をビットプレーン毎に並び替えて生成される。図9のとおり、量子化予測信号は、トップレベルからみると周波数w、ビットプレーンlの順に分解される構成となっている。なお、wは周波数を表すインデックスであり0〜15の整数、lはビットプレーンを表すインデックスであり0から5の整数とする。なお、ビットプレーン0はLSBのビットプレーンを意味し、ビットプレーン5はMSBのビットプレーンを表す。なお、図9とは逆に、ビットプレーン、周波数の順の構成であってもかまわない。また、ビットプレーンの数を6個としたのは説明を容易にするためであり、6個である必要はない(例えば8、10、12個も良い)。
付加的情報利用復号部104では、周波数毎、ビットプレーン毎にまとめられたデータを単位(=復号単位)として復号処理がなされる。ここで、周波数w、ビットプレーンlに対応する量子化予測信号をSwlとおき、復号単位ごとに動画像復号装置に入力される付加的情報をWZwlとおく。
付加的情報利用復号部104は、量子化予測信号Swl、付加的情報WZwlから、復号信号Xwlを復号する。本実施形態では、低周波数から高周波数(w=0からw=15の順)、MSBからLSBの順(l=5からl=0の順)で行うが逆の順序で復号しても構わない。
このとき、付加的情報利用復号部104は、復号信号Xwlの各ビットが1である確率(ビット尤度)を、ビット尤度推定部154から得ることにより、効率的な復号を行う。ここでいう効率的とは、付加的情報のビット量が小さい場合においても正しく復号できる可能性が高いことを意味する。
一般的な誤り訂正符号(例えば、ターボ符号や低密度パリティ検出符号)の復号では、復号対象とする信号が2値信号の列、すなわち{0、1}のビットの列である場合において、各ビットに対し0を−1、1を+1に対応させた信号{−1、1}の復号を行う。
復号処理の途中段階では、整数{−1、1}が復号結果として得られるのではなく、例えば、−1の復号結果が−1.1になるなど、実数Rが得られる。得られた実数Rを下記のような閾値処理をすることによって、{−1、1}の復号信号Oを算出する。
Figure 2010166145
{−1、1}はビット{0、1}に対応するので、結局出力として{0、1}のビットを得る。
誤り訂正符号の復号時には、復号信号Oが−1であるか1であるかの確からしさの情報(信頼度)を入力として設定することができる。より具体的には、復号信号Oが−1である確率が高い場合には、−5.4など、−1よりも小さい値を設定し、復号信号Oが1である確率が高い場合には、12.5など、1よりも大きい値を設定する。復号信号Oが−1である確率と1である確率が等しい場合には0を設定する。復号信号Oが1である確率の方が0である確率よりも高いが、その確率が所定の値よりも高くない場合には0から1の間の値を設定する。このような信頼度を用いた判定は軟判定と呼ばれる。
ビットが1である確率がP1の場合には、軟判定用の信頼度Iとして、例えば、以下の対数尤度比(LLR:LOG LIKELIHOOD RATIO)の値を与える。
log(P1/(1−P1))
なお、対数の底は自然対数(=2.718・・・)を用いる。
付加的情報利用復号部104は、ある周波数w、ビットプレーンlの信号が復号された時点で、ビット尤度推定部154に復号された信号を出力する。復号された信号は、ビット尤度推定部154内に備える確定ビット蓄積部401(後述)に蓄積される。
再構成部105により逆量子化された変換係数は、逆変換部106において逆変換がなされ画像が復号される。復号された画像は、一方では出力画像として外部に出力され、他方では、フレームメモリ107に格納される。
フレームメモリ107に格納されたフレームは、復号対象ブロックの予測画像の生成に用いることができ、また外部への出力も可能である。勿論、外部出力の代わりに、図示しない記憶部へ出力(つまり蓄積)してもよい。
以降、本実施形態の特徴部分である、予測画像生成部108、差分算出部151、変換部152、分布モデル推定部153、ビット尤度推定部154の動作を説明する。
(予測画像生成部108の説明)
予測画像生成部108では、フレームメモリ107に記録された画像から生成された2つの動き補償ブロックから予測画像を生成する。各々の動き補償ブロックをFf、Fbとすると、予測画像Pは、FfとFbの線形和、例えば、
P=(Ff+Fb)/2
により算出される。上記式中の和及び除算は、画素ごとに行われる。また、画素毎に線形和の重み係数(上記では1/2を変化させても良い)。予測画像生成部108はまた、動き補償ブロックFf、Fbを差分算出部151に出力する。
(差分算出部151の説明)
差分算出部151は、動き補償ブロックFfとFbの差分Dを算出し、変換部152に出力する。
D=Ff−Fb
上記式中の差は、画素ごとに行われる。
(変換部152の説明)
変換部152は、差分DをDCT変換し、得られた変換係数を分布モデル推定部153に出力する。ここでの変換は、変換部102と同じ変換を用いる。本実施形態では4×4の2次元DCTを用いる。
(分布モデル推定部153の説明)
分布モデル推定部153は、変換部152から入力された変換係数に基づいて、動き補償ブロック差分の変換係数の分布モデル(以降、差分分布モデルと呼ぶ)を推定する。図2に示すとおり、分布モデル推定部153は、分布モデル選択部201、特徴量抽出部202、分布パラメータ推定部203から構成される。
分布モデル選択部201は、分布モデルの種別(モデル種別)を選択する。選択する分布モデルの種類としては、本実施形態では、ラプラス分布とコーシー分布を用いる例を説明するがLevy skew alpha-stable distribution、Skew normal distributionなども有効でありこれらに限定しない。本実施形態では、ラプラス分布かコーシー分布を選択する。より具体的には、画像のサイズが所定の大きさ(例えば256×256)よりも大きい場合には、分布モデルの推定に用いられるデータ数(=特徴量の算出に用いられるデータ数)が十分にあると考えられるのでコーシー分布を用い、画像のサイズが所定の大きさよりも小さい場合にはラプラス分布を選択する。なお、裾野の広がり具合は周波数成分によって異なる。低周波成分ほどピークの値が低く裾野が広い。逆に高周波成分は裾野が狭く急峻になる。これは、一般的に自然画像においては、高周波成分が少なく、低周波成分に比べて小さな値を取る傾向にあり、その誤差の値も小さくなる傾向が高いためこのような傾向になる。そのため、ラプラス分布とコーシー分布の選択は、画像のサイズでなく、低周波数の場合はラプラス分布、高周波数の場合はコーシー分布(またはその逆)など、周波数ごとに変更しても良い。また、分布モデル選択部201を備えず、全て1つの分布(例えばコーシー分布かラプラス分布)とする構成にしても良い。また、符号化データ中のヘッダ、例えば、シーケンスのヘッダ、もしくは、ピクチャのヘッダ、もしくは、ブロックをまとめた単位であるスライスのヘッダの中に、分布種別を符号化しておき、動画像復号装置100では、復号した分布種別に基づいて、分布モデルを選択しても構わない。
以下、ラプラス分布、コーシー分布について具体的に分布モデルを説明する。下記の分布モデルは、差分分布モデル、後述する復号信号分布モデルの両者で用いられる。
(分布モデルの説明)
ラプラス分布は、モデルパラメータとして定まる所定の定数μ、σに対し、以下の関数fにより確率密度関数が表現される分布である。
Figure 2010166145
このモデルの期待値はμ、分散は2σ×σである。
コーシー分布は、モデルパラメータとして定まる所定の定数x0、γに対し、以下の関数fにより確率密度関数が表現される分布である。x0、γは各々、位置母数、尺度母数と呼ばれる。
Figure 2010166145
なお、πは円周率(約3.1415926534・・・)である。
コーシー分布は、ラプラス分布よりもピークの尖った確率密度関数を表現できるという特徴がある。
(特徴量抽出部202の説明)
特徴量抽出部202は、分布モデル選択部201で選択された分布モデルに応じて、特徴量を抽出する。図3は、特徴量抽出部202の構成を示すブロック図である。図3のとおり、特徴量抽出部202は、切替部351、平均値算出部301、分散値算出部302、頻度算出部303、頻度抽出部304から構成される。
切替部351は、分布モデル選択部201で選択されたモデル種別に応じて、特徴量抽出部202の動作を切り替える装置である。特徴量抽出部202は、モデル種別がラプラス分布の場合、ラプラス分布のモデルパラメータの推定に必要な特徴量を算出し、コーシー分布の場合、そのモデルパラメータに対応する特徴量を算出する。
今後、変換部152から出力された変換係数について、ブロックkで算出された、周波数wにおける変換係数をCwkと表現する。kは、Nをブロック数とした場合における0〜N−1の定数である。
(モデルがラプラス分布の場合)
平均値算出部301は、各変換係数の周波数wでの平均Mwを算出する。分散値算出部302では、平均値算出部301で算出された平均値Mwを用いて周波数wでの分散値Vwを算出する。
より具体的には、
Figure 2010166145
により算出する。平均値Mw、分散値Vwは分布パラメータ推定部203に出力される。
(モデルがコーシー分布の場合)
頻度算出部303は、変換係数Cwkの頻度を計測する。周波数wにおける変換係数がXである数を頻度COUNTw(X)であると定義して、図7に示すフローに従って、頻度COUNTw(X)を算出する。図7は、頻度算出部303の動作を示すフロー図である。なお、フロー図内に記載の「S」は、処理ステップを表す文字である。
S101 カウンタXに対しX=0
S102 COUNTw(X)=0
S103 カウンタkに対しk=0
S104 CwkがX以上、X+1未満の場合には(S104;Y)、S105に遷移する。そうでない場合には(S104;N)、S106に遷移する。
S105 COUNTw(X)を1だけインクリメントする。
S106 kを1だけインクリメントする。
S107 kがN−1以下なら(S107;Y)、S104に遷移し、kがN以上ならば(S107;N)、S108に遷移する。
S108 Xを1だけインクリメントする。
S109 Xが128以下なら(S109;Y)、S102に遷移し、Xが128より大きければ(S109;N)、処理を終了する。
頻度抽出部304は、各周波数wにおいてCOUNTw(X)が最大となる最頻値Xwの値を求め、分布パラメータ推定部203に出力する。さらに、頻度抽出部304は、最頻値Xwとなる場合の最頻値頻度Kwを求める。なお、最頻値頻度Kwは、ブロックの数Nで割ることにより正規化された値を用いる。
Kw=COUNTw(Xw)/N
求めた最頻値頻度Kwは分布パラメータ推定部203に出力する。
頻度抽出部304は、最頻値頻度Kwの代わりに、0のときの頻度K0、kのときの頻度K1、−kのときの頻度K2を、
K0=COUNTw(0)/N
K1=COUNTw(k)/N
K2=COUNTw(-k)/N
により求め、分布パラメータ推定部203に出力しても良い。なお、kは所定の定数、例えば1を用いる。
また、Kw、K0、K1、K2に限らず、最頻値周辺もしくは0周辺の複数の頻度を求め、分布パラメータ推定部203に出力しても構わない。
なお、モデル種別がラプラス分布及びコーシー分布においても、モデル種別に応じて、特徴量抽出部202は、変換係数Cwkの1つ以上のモーメント(1次モーメントの平均、2次モーメントの分散、もしくはより高次のモーメント)、もしくは、変換係数Cwkの頻度を抽出することが好適である。
(分布パラメータ推定部203の説明)
分布パラメータ推定部203は、分布モデルの関数を定める分布パラメータを算出する。分布モデルとしてラプラス分布を用いる場合には、分布パラメータ推定部203は、平均値Mw、分散値Vwを用いて、以下のように周波数w毎にモデルパラメータを推定する。
Figure 2010166145
分布モデルとしてコーシー分布を用いる場合には、分布パラメータ推定部203は、最頻値Xwと、最頻値頻度Kwを用いて、以下のように周波数w毎にモデルパラメータを推定する。
x0w=Xw
γw=π/Kw
なお、頻度抽出部304より、最頻値頻度Kwではなく、3点の頻度K0、K1、K2が与えられた場合には、以下の式によりモデルパラメータγwを得る。
γw=π×k×k/{(1/K1+1/K2)/2−1/K0}
この場合、1点の頻度Kwではなく、3点の頻度K0、K1、K2から求めるため、尺度母数γの推定精度が高くなる。
Kw、K0、K1、K2以外にも、3点以上の頻度が頻度抽出部304から入力されれば、さらに高精度のγの推定が可能である。なお、コーシー分布の分布パラメータの算出方法は上記に限定しない。すなわち、位置母数x0wを0と仮定する場合や3点よりも多い場合には、ニュートン法や最小二乗法などを用いてγを推定することが可能であるが、ここでは説明しない。
なお、モデル種別がラプラス分布及びコーシー分布においても、モデル種別に応じて、変換係数Cwkの1つ以上のモーメント、もしくは、変換係数Cwkの頻度からモデルパラメータを推定することが好適である。
(ビット尤度推定部154の説明)
ビット尤度推定部154は、付加的情報利用復号部104に入力される量子化予測信号Swlを復号して得られる、復号信号Xwlの各ビットが0であるか1であるかの確率(0以上1以下の実数)を算出するものである。具体的には、周波数成分w、ビットプレーンlの量子化予測信号におけるブロックkのビットが1である確率P1を出力する。
ビット尤度推定部154には、変換部102から予測信号である変換係数Cwkが入力され、付加的情報利用復号部104から復号された信号が入力され、分布モデル推定部153から、モデル種別とモデルパラメータが入力される。
図8は、ビット尤度推定部154におけるビット尤度の算出方法を説明するための模式図である。
図8の(a)(b)のグラフは、ある周波数成分w、ブロックkの復号信号Xwlのブロックkのビットが確率的にどのように分布するかを示す確率密度関数P(x)である。復号信号xと量子化予測信号y、予測誤差nの関係を
x=y+n
とあらわすと、通常予測誤差nは0を中心として分布すると考えられるため、xの期待値E(x)は、量子化予測信号yに一致する。従って、確率密度関数P(x)の極大値は、予測信号Cwkと一致する。
以降、xの確率密度関数P(x)が与えられた場合に、xの各ビットが0であるか1であるかの確率の推定方法について説明する。
まず、説明の準備として、確率密度関数P(x)の値域をΩであらわす。本実施形態の場合、−32以上31以下の整数とする。xを6ビット2進数として表すと、LSBからMSBの各ビットがb0、b1、b2、b3、b4、b5であるとして表現することができる。また、
x=b5×32+b4×16+b3×8+b2×4+b1×2+b0×1−32
を満たす。
なお、Ωの値域を6ビットで表現できる−32以上、31以下の整数としたのは説明上の都合であり、実際には例えば12ビット整数の−2048以上、2047以下のようなより大きな値域を用いることが適当である。
xが確率密度関数P(x)から得られた値である場合、xのMSBすなわち、b5が1である確率と0である確率は以下のように求めることができる。図8(a)において、b5が1である区間は区間(a)で示した区間のうち網目の領域であり、b5が0である区間は斜線領域である。xが1である確率は、確率密度関数の網目領域の面積に比例し、xが0である確率は、確率密度関数の斜線領域の面積に比例する。
よって、b5が1になる確率は、
網目領域の面積/(網目領域の面積+斜線領域の面積)
で推定され、逆に、b5が0になる確率は、
斜線領域の面積/(網目領域の面積+斜線領域の面積)
で推定される。
このように、値xがある確率密度関数P(x)から与えられたものである場合には、確率密度関数を利用して、xをビット列として表現した場合におけるあるビットが0か1になる確率(ビット尤度)を推定することができる。
また、図8(b)は、特に、b5が1であると分かっている場合におけるb4のビット尤度(条件付確率)を推定する場合を示す図である。b5が1であるから、区間(b)で示すように、xが黒領域で示される区間にあることが確定している。また、b4が1である区間が編線領域、b4が0である領域が斜線領域となる。b4が1になる確率は、グラフより、
網目領域の面積/(網目領域の面積+斜線領域の面積)
で推定され、逆に、b4が0になる確率は、
斜線領域の面積/(網目領域の面積+斜線領域の面積)
で推定される。b5が1であると分かっている分、より正確にビット尤度の推定が可能である。
上記のようにビット尤度を推定するためには、分布モデルを示す確率密度関数と、ビットが0となる区間と、ビットが1となる区間が必要になる。
図4はビット尤度推定部154の構成を示すブロック図である。ビット尤度推定部154は、確定ビット蓄積部401、値集合算出部402、逆量子化値集合算出部403、値領域面積算出部404、モデル分布値算出部405、確率算出部406から構成される。
確定ビット蓄積部401は、付加的情報利用復号部104から伝達される、量子化予測信号のうち、すでに復号済みのビットを確定ビットとして蓄積する。量子化予測信号は、ブロック毎に周波数変換されビットプレーン分解された信号であるから、周波数w、ビットb、ブロックkのビットの集合である。本実施形態では、ビットプレーンの深度は6、すなわち、ビット位置としてはLSBから順にb0からb5の6個があるものとする。
より具体的には、ビットプレーンl(l=0、1、2、3、4、5の整数)が復号された時点で、l以上のビットプレーンに対応する。量子化予測信号のビット列Xwlを蓄積する。
値集合算出部402は、ある周波数w、ブロックk、ビット位置bが与えられた場合における、ビット位置bにおける値Xが0である値の集合と、Xが1である値の集合を求める。ビット位置はb0、b1、b2、b3、b4、b5のいずれかである。
図5は、値集合算出部402の動作を説明するための模式図である。図5に示すとおり、値集合算出部402には、求めるビット位置bと、確定ビットが与えられる。図のようにビット位置bがb3である場合、MSBから復号する場合には、すでにb5、b4が確定している。この確定ビットの値は、周波数w、ブロックkにより異なるが、ここでは説明のために図のとおり2進数表示で11であるとする。
このとき、値集合算出部402は、2進数表示で、値が11Xxxx(xは0か1の整数)で表される集合を、X=0の場合、とX=1の場合について求める。
例えば、X=1である集合は、2進数表示で111xxx(xは0か1の整数)である。図8のとおり、求められたXが1である値の集合X1と、Xが0である値の集合X0は、逆量子化値集合算出部403に出力される。
逆量子化値集合算出部403は、入力された集合X1、X0から、yを量子化した場合にX1となるyの集合Y1、yを量子化した場合にX0となるyの集合Y0を求める。このときの量子化方法は、量子化部103と同じとする。
量子化部103における量子化が、量子化ステップをQPとした場合において
X=(Y+OFFSET)//QP
であらわされる場合について説明する。なおOFFSETは所定の定数であり、OFFSET=QP/2(もしくはQP/3)が好ましいとされている。なお、//は、切捨て整数化により整数化する除算である。
この場合、量子化して値xとなる値yは、
y=x×QP−OFFSET、x×QP−OFFSET+1、・・・、x×QP−OFFSET+QP−1となる。
集合X1の要素をX1m、mを0〜n−1で表した場合においては、求める集合Y1は、n個の区間{MINm、MAXm}で表現できる。
但し、
MINm=X1m×QP−OFFSET
MAXm=X1m×QP−OFFSET+QP−1
mは0〜n−1である。
集合X0が与えられた場合も同様に、
MINm=X0m×QP−OFFSET
MAXm=X0m×QP−OFFSET+QP−1
からなる区間{MINm、MAXm}として集合Y0を求めることができる。求めた逆量子化値集合Y0、Y1は値領域面積算出部404に出力される。
分布モデル値算出部405は、ある周波数成分w、ブロックkの予測信号Cwkが復号された場合に、復号信号がどのように分布するかを示す確率密度関数P(x)を定め、入力値xでの値P(x)を出力する。以降、復号信号の分布は、予測信号を中心とする予測誤差の特性に応じた広がりを持つ分布であり、復号信号分布モデルと呼ぶ。
まず、入力された予測信号Cwk、分布種別、モデルパラメータからP(x)を定める。入力されたモデル種別がラプラス分布の場合には、入力された変換係数Cwkに対し、確率密度関数P(x)を
平均 Mwk=Cwk
分散 σwk=α×σ
に従う式(1)として定める。ここで、αは、所定の定数であり、差分分布モデルの分布の広がり具合σと、復号信号分布モデルの分布の広がり具合σwkの関係を示す。
入力されたモデル種別がコーシー分布の場合には、入力された変換係数Cwkに対し、
x0wk=Cwk
γwk=β×γw
である。βは所定の定数である。αと同様、差分分布モデルの分布の広がり具合と復号信号分布モデルの分布の広がり具合の関係を示す値であり、あらかじめ適当な値を求めておく。
確率密度関数P(x)を定めた時点で、分布モデル値算出部405は、入力値xにおける値P(x)を求め、値領域面積算出部404に出力する。
値領域面積算出部404は、分布モデル値算出部405を用いて、分布モデルが、逆量子化値集合Y1(あるいはY0)の区間となる領域の面積を求める。求める面積は、図8の説明における、網目領域の面積及び斜線領域の面積に相当する。
具体的には、分布モデル値算出部405にY0、Y1の要素y0l(l=0〜n)、y1l(l=0〜n)を入力し、その出力値P(y0l)、P(y1l)の和を算出する。式で示すと
Figure 2010166145
となる。SUM0、SUM1は、値集合算出部402において値集合X1、X0を算出する際に対象としたXが0である確率に比例する面積、Xが1である確率に比例する面積である。得られたSUM0、SUM1は確率算出部406に出力される。
確率算出部406は、確率密度関数の区間面積SUM0、SUM1から、以下の式によりXが0である確率P0とXが1である確率P1を算出する。
P0=SUM0/(SUM0+SUM1)
P1=SUM1/(SUM0+SUM1)
確率算出部406は、ビット尤度推定部153の入力としてある周波数w、ブロックk、ビット位置bが与えられた場合における、ビット位置bにおける値Xが1である確率P1を付加的情報利用復号部104に出力する。なお、P1=1−P0の関係があるため確率P1ではなく確率P0を出力しても構わない。
<第2の実施形態の説明>
上記分布モデル推定部153において、差分分布モデルを求め、差分分布モデルから復号信号分布モデルを推定する方法について説明したが、変換係数と、予測信号とから、直接、復号信号分布モデルを求める分布モデル推定部を備えた動画像復号装置ついて説明する。
図11は、変換係数、予測信号から、直接、復号信号分布モデルを求める第2の実施形態の動画像復号装置の構成を示す図である。
図1で例示する動画像復号装置1300は、イントラ復号部101、変換部102、量子化部103、付加的情報利用復号部104、再構成部105、逆変換部106、フレームメモリ107、予測画像生成部108、差分算出部151、変換部152、分布モデル推定部1353、ビット尤度推定部154から構成される。
図12は、本実施形態の分布モデル推定部1353の構成を示すブロック図である。
分布モデル推定部1353は、分布モデル選択部201、特徴量抽出部202、分布パラメータ推定部1403を備える。
分布パラメータ推定部1403は、分布種別に応じた特徴量と、予測信号Cwkを入力として、復号信号分布モデルのモデルパラメータを求める。
分布モデルとしてラプラス分布を用いる場合には、分布パラメータ推定部1403は、分散値Vwを用いて、以下のように周波数w、ブロックk毎にモデルパラメータを推定する。
Figure 2010166145
分布モデルとしてコーシー分布を用いる場合には、分布パラメータ推定部1403は、最頻値Xwと、最頻値頻度Kwを用いて、以下のように周波数w、ブロックk毎にモデルパラメータを推定する。
x0wk=Cwk
γwk=β×π/Kw
推定したモデルパラメータは、ビット尤度推定部154に出力される。復号信号分布モデルのモデルパラメータが入力された場合、ビット尤度推定部154内の分布モデル値算出部405の一部動作を省略する。具体的には、ある周波数成分w、ブロックkの予測信号Cwkが復号された場合に、復号信号がどのように分布するかを示す確率密度関数P(x)を定めることは、分布パラメータ推定部1403により既に行われているため省略する。ビット尤度推定部154のその他の動作は、既に説明したとおりである。
以上説明したように、本発明の動画像復号装置100、1300では、予測画像の生成に用いた予測画像の差分をDCT変換し、変換した変換係数から分布モデルを推定し、推定した分布モデルを用いて、ビット尤度を算出することによって、付加的情報利用復号の性能を向上させる。これにより、符号化効率を向上する。
<第3の実施形態の説明>
第1の実施形態又は第2の実施形態の動画像復号装置に、さらにビット尤度推定部154の動作の良さを評価するビット尤度評価部1561を追加した動画像復号装置について説明する。
図13は、第3の実施形態の動画像復号装置の構成を示すブロック図である。図13で例示する動画像復号装置1500は、イントラ復号部101、変換部102、量子化部103、付加的情報利用復号部104、再構成部105、逆変換部106、フレームメモリ107、予測画像生成部108、差分算出部151、変換部152、分布モデル推定部1353、ビット尤度推定部154、ビット尤度評価部1561から構成される。1501は、ビット尤度、1502は、量子化予測信号、1503は、復号信号を意味し、各々、ビット尤度評価部1561に入力される。
図14は、ビット尤度評価部1561の構成を示すブロック図である。ビット尤度評価部1561は、ビット尤度格納部1601、量子化予測信号格納部1602、誤り訂正後信号格納部1603、誤り率推定部1604、推定誤り率ソート部1605、クラスタリング部1606、クラスタ誤り率推定部1607、クラスタ誤り率測定部1608、ビット尤度評価値算出部1609から構成される。
ビット尤度格納部1601は、周波数成分w、ビットプレーンlの量子化予測信号におけるビットが1である確率P1を格納する。
予測信号格納部1602は、周波数成分w、ビットプレーンlの量子化予測信号Swlを格納する。
誤り訂正後信号格納部1603は、周波数成分w、ビットプレーンlの復号信号Xwlを格納する。
誤り率推定部1604は、ビット尤度格納部1601に格納されたビット尤度と、量子化予測信号格納部1602に格納された量子化予測信号を用いて、周波数成分w、ビットプレーンlの量子化予測信号Swlの誤り率を推定する。
誤り率とは、付加的情報利用復号部104において量子化予測信号Swlが訂正される割合である。すなわち、量子化予測信号Swlのビットが0である場合に1に訂正される数と量子化予測信号のビットが1である場合の数の和である誤り数を、量子化予測信号Swlの全体のビット数で割った値である。
各ビットにおける誤り率の推定値は、量子化予測信号のあるビットが0である場合に1に復号される確率P1、量子化予測信号のあるビットが1である場合に0に復号される確率1−P1である。従って、誤り率推定部1604はビット毎に、下記のように推定誤り率Rwlkを推定し格納する。
Rwlk=P1 (Swlk=0の場合)
1−P1 (Swlk=1の場合)
推定誤り率ソート部1605は、誤り率推定部で求められたRwlkを誤り率の順にソートする。ソートの順は、誤り率の大きい方から小さい方に順序でも、その逆でも構わないが、ここでは小さい方から大きい方にソートする。推定誤り率ソート部1605は、Rwlkをソートする際、Rwlkとその位置を示すインデックスkを組{Rwlk、k}をソートする。
クラスタリング部1606は、推定誤り率ソート部1605でソートされた推定誤り率とインデックスの組{Rwlk、k}を、推定誤り率Rwlkを用いてクラスタリングする。
図15は、クラスタリング部1606の動作を説明する図である。図15に示すように、クラスタリング部1606は、推定誤り率Rwlkの小さい順からN1個、N2個、N3個・・・、Nm個と抽出することにより、クラスタ1からクラスタmまでのm個にクラスタリングする。ここでmは1以上の所定の定数とする。
誤り率が低い場合の方が、要素の数に対して発生する誤り数が小さいため、正確な誤り率を推定するにはより多くの要素が必要である。このことを考慮して、各クラスタの要素の個数については、i<jとなるクラスタi、クラスタjについて、Ni>=Njとなることが望ましい。すなわち、推定誤り率の小さいクラスタの方が、推定誤り率が大きいクラスタよりも、クラスタの要素の個数が多い方が好ましい。
本実施形態では、ブロックの数Nを用いて、例えば、
N1=N/2
N2=N/4
N3=N/8
N4=N/16
N5=N/16
と定める。すなわち、隣接するクラスタにおいて、推定誤り率の大きいクラスタの要素が、推定誤り率の小さいクラスタの要素の半分になるように定める。
漸化式で示すと、以下の式で示される。
N1=N/2
Ni+1=Ni/2 (i<m)
Nm=N−(N1+N2+・・・+Nm−1)
クラスタ誤り率推定部1607は、クラスタリング部1606でクラスタリングされたクラスタ毎に、誤り率推定部1604で求められた推定誤り率の平均値を算出する。具体的には、クラスタ誤り率推定部1607に備える図示しない加算部を用いて、クラスタiに属するインデックスのRwlkを全て加算し、クラスタ誤り率推定部1607に備える図示しない除算部を用いて、クラスタの要素数で割ることによりクラスタ毎の推定誤り率EstRwliを算出する。
上記計算は、クラスタiに属するインデックスの集合をΩiで表すと、k∈{Ωi}について加算を意味するΣを用いて、
EstRwli=ΣRwlk/Ni k∈{Ωi}
と表現できる。
算出された推定誤り率EstRwliは、ビット尤度評価値算出部1609に出力される。
クラスタ誤り率測定部1608は、クラスタリング部1606でクラスタリングされたクラスタ毎に、量子化予測信号格納部1602に格納された量子化予測信号と、誤り訂正後信号格納部1603に格納された復号信号を用いて、実際の誤り率を測定する。具体的には、クラスタ誤り率推定部1607に備える図示しない誤り数測定部を用いて、クラスタiに属するインデックスの量子化予測信号Swlkと復号信号Xwlkが一致しない場合の数(量子化予測信号Swlが訂正される数、誤り数)を測定する。一致しない場合とは、1が0に、もしくは、0が1に訂正された場合であり誤り数ERRiを意味する。続いて、クラスタ誤り率推定部1607に備える図示しない除算部を用いて、誤り数ERRiをクラスタの要素数で割り、クラスタ毎の誤り率RealRwliを算出する。
式では以下のように表現できる。
RealRwli=ERRi/Ni
算出された測定誤り率RealRwliは、ビット尤度評価値算出部1609に出力される。
図16は、推定誤り率EstRwliと測定誤り率RealRwliをクラスタ毎に並べて示したものである。各クラスタにおいて、推定誤り率EstRwliと測定誤り率RealRwliが近いほど、精度の高いビット尤度推定が行えたと言える。
ビット尤度評価値算出部1609は、推定誤り率EstRwliと測定誤り率RealRwliの差を、クラスタi毎に算出し、ビット尤度評価値Ewlを算出する。具体的には、
Ewl=Σ(|EstRwli−RealRwli|/RealRwli)
により求める。なお、上記式において、Σはiに関する加算、|x|はxの絶対値を求める関数を表す。またRealRwli=0となるiについては|EstRwli−RealRwli|/RealRwliを0として加算する。
一般に、測定誤り率RealRwliが小さい場合の方が誤り率の推定精度が高い必要がある。そのため上記式では、推定誤り率EstRwliと測定誤り率RealRwliの差を、測定誤り率RealRwliで割ることにより、測定誤り率RealRwliが小さいほど、差の重みが大きくなるように調整している。
なお、推定誤り率EstRwliと測定誤り率RealRwliの差が大きいほど、Ewlが大きくなるような関数であれば、ビット尤度評価値の算出は、上記式に限る必要はない。
なお、ビット尤度評価値算出部1609は、ビット尤度評価値としてスカラー値ではなく、ベクトル値を出力しても良い。より具体的には、推定誤り率EstRwliと測定誤り率RealRwliの差を、クラスタi毎に算出し、その差DIFFiをベクトルとして出力する。
DIFFi=|RealRwli−EstRwli|
この場合も、RealRwliで割ることにより、正規化してもかまわない。
DIFFi=|RealRwli−EstRwli|/RealRwli
但し、RealRwli=0のときはDIFFi=0とする。
以上説明したように、本発明の動画像復号装置1500では、ビット尤度評価部1561を設けることにより、ビット尤度推定部154の動作の良さを評価することができる。
尚、本発明の画像復号装置は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。
100、1300、1500 動画像復号装置
101 イントラ復号部
102 変換部
103 量子化部
104 付加的情報利用復号部
105 再構成部
106 逆変換部
107 フレームメモリ
108 予測画像生成部
151 差分算出部
152 変換部
153、1353 分布モデル推定部
154 ビット尤度推定部
201 分布モデル選択部
202 特徴量抽出部
203、1403 分布パラメータ推定部
301 平均値算出部
302 分散値算出部
303 頻度算出部
304 頻度抽出部
351 切替部
401 確定ビット蓄積部
402 値集合算出部
403 逆量子化値集合算出部
404 値領域面積算出部
405 分布モデル値算出部
406 確率算出部
500 動画像符号化装置
501 イントラ符号化部
502 変換部
503 量子化部
504 付加情報生成部
505 フレーム振り分け部
600 動画像復号装置
601 イントラ復号部
602 変換部
603 量子化部
604 付加的情報利用復号部
605 再構成部
606 逆変換部
607 フレームメモリ
608 予測画像生成部
1501 ビット尤度
1502 量子化予測信号
1503 復号信号
1561 ビット尤度評価部
1601 ビット尤度格納部
1602 量子化予測信号格納部
1603 誤り訂正後信号格納部
1604 誤り率推定部
1605 推定誤り率ソート部
1606 クラスタリング部
1607 クラスタ誤り率推定部
1608 クラスタ誤り率測定部
1609 ビット尤度評価値算出部

Claims (4)

  1. 復号した画像を蓄積するフレームメモリと、
    前記フレームメモリに蓄積された画像から、2つの動き補償画像を生成し、生成された動き補償画像の線形和によって、復号対象となる画像の予測画像を生成する予測画像生成部と、
    前記予測画像を周波数変換し、予測信号を生成する第1の変換部と、
    前記第1の変換部により生成された前記予測信号の変換係数を量子化する量子化部と、
    量子化された前記変換係数を、動画像符号化装置より伝送された付加的情報を用いて、復号する付加的情報利用復号部と、
    前記予測画像生成部で生成された2つの動き補償画像の差分画像を算出する差分算出部と、
    前記差分画像を周波数変換する第2の変換部と、
    前記第2の変換部により周波数変換された変換係数の差分特徴量を抽出する特徴量抽出部と、
    抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する分布モデル推定部と、
    推定された差分分布モデルから復号信号分布モデルを算出し、該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが0か1かの確率を示すビット尤度を推定するビット尤度推定部と、
    を備え、
    前記付加的情報利用復号部は、前記ビット尤度推定部で推定された前記ビット尤度を用いて、復号処理を行うことを特徴とする動画像復号装置。
  2. 前記分布モデル推定部は、抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する代わりに、前記差分特徴量と前記予測信号と用いて、直接、復号信号分布モデルを算出し、前記ビット尤度推定部は、算出された該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが0か1かの確率を示すビット尤度を推定するようにしたことを特徴とする請求項1に記載の動画像復号装置。
  3. 前記分布モデル推定部は、コーシー分布とラプラス分布を含む複数の分布モデルから、推定対象とする分布モデルを選択する分布モデル選択部を備え、
    前記特徴量抽出部は、前記選択された分布モデルに応じた前記変換係数の差分特徴量を抽出することを特徴とする請求項1または請求項2に記載の動画像復号装置。
  4. 前記特徴量抽出部は、頻度算出部と、該頻度算出部で算出された頻度データを用いて少なくとも最頻値頻度を含む頻度を抽出する頻度抽出部と、を備え、
    前記分布モデル推定部は、分布モデルがコーシー分布である場合、前記頻度抽出部により抽出された前記頻度に基づいて、該コーシー分布のモデルパラメータを算出することを特徴とする請求項1から請求項3のいずれか1項に記載の動画像復号装置。
JP2009004844A 2009-01-13 2009-01-13 動画像復号装置 Pending JP2010166145A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009004844A JP2010166145A (ja) 2009-01-13 2009-01-13 動画像復号装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009004844A JP2010166145A (ja) 2009-01-13 2009-01-13 動画像復号装置

Publications (1)

Publication Number Publication Date
JP2010166145A true JP2010166145A (ja) 2010-07-29

Family

ID=42582000

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009004844A Pending JP2010166145A (ja) 2009-01-13 2009-01-13 動画像復号装置

Country Status (1)

Country Link
JP (1) JP2010166145A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010193304A (ja) * 2009-02-19 2010-09-02 Oki Electric Ind Co Ltd 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP2010212863A (ja) * 2009-03-09 2010-09-24 Oki Electric Ind Co Ltd 動画像符号化装置、及び動画像復号装置、並びに動画像伝送システム
JP2014027600A (ja) * 2012-07-30 2014-02-06 Oki Electric Ind Co Ltd 動画像復号装置及びプログラム、並びに、動画像符号化システム
JP2014165849A (ja) * 2013-02-27 2014-09-08 Oki Electric Ind Co Ltd 動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システム
JP2015065645A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法
JP2015065644A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010193304A (ja) * 2009-02-19 2010-09-02 Oki Electric Ind Co Ltd 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP2010212863A (ja) * 2009-03-09 2010-09-24 Oki Electric Ind Co Ltd 動画像符号化装置、及び動画像復号装置、並びに動画像伝送システム
JP2014027600A (ja) * 2012-07-30 2014-02-06 Oki Electric Ind Co Ltd 動画像復号装置及びプログラム、並びに、動画像符号化システム
JP2014165849A (ja) * 2013-02-27 2014-09-08 Oki Electric Ind Co Ltd 動画像符号化装置及びプログラム、動画像復号装置及びプログラム、並びに、動画像配信システム
JP2015065645A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法
JP2015065644A (ja) * 2013-09-25 2015-04-09 三菱電機株式会社 画像推定方法

Similar Documents

Publication Publication Date Title
US8340192B2 (en) Wyner-Ziv coding with multiple side information
JP5131224B2 (ja) 動画像復号装置、方法及びプログラム、動画像符号化装置、方法及びプログラム、並びに、動画像符号化システム
JP4949836B2 (ja) 記述的モデルパラメータを用いたエンハンスメントレイヤデータを符号化及び復号化するシステム及び方法
JP2010166145A (ja) 動画像復号装置
AU2008259744B2 (en) Iterative DVC decoder based on adaptively weighting of motion side information
JP5233939B2 (ja) 動画像符号化装置及びプログラム、並びに、動画像配信システム
Ayzik et al. Deep image compression using decoder side information
JP2012124890A (ja) 符号化信号を、この符号化信号と副情報との間の統計的依存性に基づいて復号する方法および復号器
Zhou et al. Distributed video coding using interval overlapped arithmetic coding
JP6093546B2 (ja) ブロックの再構成方法、符号化方法、復号化装置及び符号化装置
JP5851987B2 (ja) 算術符号化及び復号化方法
JP2013098984A5 (ja) ブロックの再構成方法、符号化方法、復号化装置及び符号化装置
US8594196B2 (en) Spatial Wyner Ziv coding
JP2005057789A (ja) ディジタルのソース画像を圧縮する装置および方法
JP5016561B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、及び動画像復号方法
KR101802334B1 (ko) 적응적 탬플릿을 이용한 이진 영상의 부호화 방법 및 장치, 그 복호화 방법 및 장치
KR101152482B1 (ko) 고속 부호율-적응 저밀도 패리티 코드를 이용한 복호화 방법 및 이러한 방법을 사용하는 부/복호화 장치
JP4730144B2 (ja) 復号化装置、逆量子化方法及びこれらのプログラム
JP2002152049A (ja) データ処理装置及びデータ処理方法
CN116527943B (zh) 基于矢量量化索引和生成模型的极限图像压缩方法及系统
Wu et al. Image vector quantization codec indices recovery using Lagrange interpolation
US7720300B1 (en) System and method for effectively performing an adaptive quantization procedure
KR101180539B1 (ko) 분산비디오 부호화 영상의 복호화 장치 및 그 방법
Ulacha et al. Predictor blending technique for lossless and near-lossless image coding
JP5351093B2 (ja) 画像符号化方法,画像符号化装置および画像符号化プログラム