JP2010166145A

JP2010166145A - 動画像復号装置

Info

Publication number: JP2010166145A
Application number: JP2009004844A
Authority: JP
Inventors: Ryoji Hashimoto; 亮司橋本; Takao Onoe; 孝雄尾上; Hiroshi Tsutsui; 弘筒井; Tomohiro Igai; 知宏猪飼
Original assignee: Osaka University NUC; Sharp Corp
Current assignee: Osaka University NUC; Sharp Corp
Priority date: 2009-01-13
Filing date: 2009-01-13
Publication date: 2010-07-29

Abstract

【課題】予測画像の差分画像の分布モデルを推定し、推定した分布モデルを用いて、ビット尤度を算出し、付加的情報利用復号の性能を向上する動画像復号装置を提供する。
【解決手段】動画像復号装置１００は、イントラ復号部１０１、変換部１０２、量子化部１０３、付加的情報利用復号部１０４、再構成部１０５、逆変換部１０６、フレームメモリ１０７、予測画像生成部１０８、差分算出部１５１、変換部１５２、分布モデル推定部１５３、ビット尤度推定部１５４から構成され、予測画像の生成に用いた予測画像の差分画像をＤＣＴ変換し、変換した変換係数から分布モデルを推定し、推定した分布モデルを用いて、ビット尤度を算出し、付加的情報利用復号に供する。
【選択図】図１

Description

本発明は、動画像符号化装置により符号化された動画像の復号を行う動画像復号装置に関する。

＜予測符号化の説明＞
従来から、動画像符号化方式として、ＭＰＥＧ（ＭｏｖｉｎｇＰｉｃｔｕｒｅＥｘｐｅｒｔｓＧｒｏｕｐ）やＨ．２６ｘシリーズなどの方式が知られている。これらの方式では、動き補償技術を用いて符号化対象画像の予測画像を生成し、符号化対象画像と予測画像の差分を符号化することによって動画像を符号化する。このような符号化方式は予測符号化方式と呼ばれる。

以下、予測符号化を行う装置及びその復号を行う装置の一般的な構成を説明する。今、Ｘを符号化対象信号、ＹをＸの予測信号、ＮをＸとＹの予測誤差とすると、
Ｘ＝Ｙ＋Ｎ
である。予測符号化の符号化装置では、予測信号Ｙを生成し予測誤差Ｎ（＝Ｘ−Ｙ）を算出した上で、予測信号Ｙを生成するための情報と予測誤差Ｎを符号化する。

復号装置では、まず予測信号を生成するための情報から予測信号Ｙを復号し、さらに予測誤差Ｎを復号する。続いて、得られた予測信号Ｙと予測誤差Ｎを下式のように加算することで、符号化対象信号Ｘを復号する。
Ｘ＝Ｙ＋Ｎ

＜ＤｉｓｔｒｉｂｕｔｅｄＶｉｄｅｏＣｏｄｉｎｇの説明＞
ところで、近年、新しい動画像符号化方式としてＤｉｓｔｒｉｂｕｔｅｄＶｉｄｅｏＣｏｄｉｎｇ（以下、ＤＶＣ符号化と称する）と呼ばれる符号化方式が知られるようになった（例えば、非特許文献１及び特許文献１を参照）。ＤＶＣ符号化は、誤り訂正技術を用いると、一定の誤りのある符号を訂正することが可能であるという原理を利用したものである。

以下、ＤＶＣ符号化を行う装置及びその復号を行う装置の一般的な構成を説明する。予測符号化の説明と同様、符号化対象信号をＸ、Ｘの予測信号をＹ、ＸとＹの予測誤差をＮとすると、
Ｘ＝Ｙ＋Ｎ
である。

ＤＶＣ符号化の符号化装置では、予測信号Ｙの生成を行わず、復号装置で予測信号Ｙを生成する。ＤＶＣ符号化の特徴は、符号化装置で予測信号Ｙを生成しない分、符号化に必要な演算量が小さいことである。符号化装置では、予測信号Ｙを生成しないことから、予測誤差Ｎを求めることはできない。そこでＤＶＣ符号化では、予測誤差Ｎを符号化する代わりに、符号化対象信号Ｘの誤り訂正用の情報を符号化する。

誤り訂正用の情報としては、一般の誤り訂正符号が利用できる。誤り訂正符号には、畳み込み符号、ターボ符号、低密度パリティ検出符号などがあるが、ＤＶＣ符号化にはそのいずれもが利用可能である。ＤＶＣ符号化では誤り訂正用の情報を圧縮に使うが、その使い方は、伝送や蓄積など通常の誤り訂正符号の使い方とは異なる。

誤り訂正符号の通常の使い方（例えば信号Ｘの伝送）では、誤り訂正符号化により信号ＸのパリティＷＺを生成した後、元の信号ＸとパリティＷＺの両者を伝送する。受信側では、信号ＸとパリティＷＺの組を受け取り、それらの組から誤りを訂正することで誤りのない信号Ｘが得られる。

それに対し、ＤＶＣ符号化では、信号Ｘを圧縮対象とすると、信号ＸのパリティＷＺを生成後、信号Ｘ自体は破棄し、パリティＷＺのみを伝送する。一般に、パリティＷＺは、信号Ｘよりも情報量が小さいため、信号ＸをパリティＷＺに置き換えることで符号量を削減できる。

ＤＶＣ符号化の手順を式で記述すると、
ＷＺ＝パリティ生成（Ｘ）
である。

ＤＶＣ符号化の復号装置では、まず、ＤＶＣ符号化による符号化データとは異なる、復号装置に入力される情報（例えば前後のフレームから予測した動きベクトルなど）を用いて、信号Ｘの予測値（予測信号Ｙ）を生成する。予測信号Ｙは、Ｘに誤りＮが載った信号とみなすことができることから、パリティＷＺを用いて予測信号Ｙの誤りを訂正することで、Ｘを再生することができる。
ＤＶＣ符号化の復号の手順を式で記述すると、
Ｘ＝誤り訂正（Ｙ，ＷＺ）
である。

＜ＤＶＣ符号化のための装置の具体的な構成の説明＞
以下、具体的なＤＶＣ符号化に関する装置の構成を説明する。図１７は、従来のＤＶＣ符号化を用いた動画像符号化装置及び動画像復号装置を示すブロック図である。動画像符号化装置５００は、イントラ符号化部５０１、変換部５０２、量子化部５０３、付加的情報生成部５０４、及びフレーム振り分け部５０５から構成される。動画像復号装置６００は、イントラ復号部６０１、変換部６０２、量子化部６０３、付加的情報利用復号部６０４、再構成部６０５、逆変換部６０６、フレームメモリ６０７、予測画像生成部６０８、から構成される。

＜ＤＶＣ符号化の動画像符号化装置の動作説明＞
動画像符号化装置５００に入力された符号化対象フレームはフレーム振り分け部５０５によって、キーフレームとキーフレーム以外（以下、ＷＺフレームと呼ぶ）に振り分けられる。キーフレームは、イントラ符号化部５０１においてフレーム内符号化方式により符号化される。ＷＺフレームは、空間的冗長性を削減するためＤＣＴ変換などを行う変換部５０２で変換され、量子化部５０３で量子化された後、付加的情報生成部５０４で付加的情報が生成される。この付加的情報がＷＺフレームの符号化データである。キーフレームは、ＷＺフレームの予測を可能にするために必要なものであり、数フレームに１枚の割合で符号化される。ここで、最初のＷＺフレームを符号化する前には複数枚（２枚以上）のキーフレームを符号化する。このように動画像符号化装置５００では、符号化の結果としてキーフレームの符号化データとＷＺフレームの符号化データが生成され、外部へ出力されるか記憶部（図示せず）に蓄積される。なお、ＤＣＴ変換を行う変換部５０２を備えず、画素領域のまま、量子化し誤り訂正符号などの付加的情報を生成する構成の符号化装置も存在する。

＜ＤＶＣ符号化の動画像復号装置の動作説明＞
動画像復号装置６００では、まず、キーフレームの符号化データを受信し、その符号化データからイントラ復号部６０１によりキーフレームが復号される。復号されたキーフレームはフレームメモリ６０７に格納される。続いて、動画像復号装置６００は、ＷＺフレームの符号化データを受信する。ＷＺフレームの符号化データを受信すると、まず、フレームメモリ６０７に格納されたフレームを参照フレームとして予測画像が生成される。

予測画像の生成について説明する。ＷＺフレームを復号する時点では、フレームメモリ６０７には少なくとも複数枚の参照フレームが存在している（最初のＷＺフレームを復号する時点においてもすでに複数枚のキーフレームが復号されフレームメモリ６０７に格納されている）。予測画像生成部６０８では、１）参照フレーム間の動きを探索し、２）参照フレームと復号対象フレームの間隔に基づいて、動きの内挿もしくは外挿により、復号対象フレームと参照フレーム間の動きを推定し、３）推定された動きにより、参照フレームを用いて復号対象画像を予測する。以上の流れで予測画像を生成することができる。

生成された予測画像は変換部６０２でＤＣＴ変換などの変換がなされる。予測画像の変換係数は、一方では量子化部６０３に入力され、他方では再構成部６０５に入力される。量子化部６０３では、予測画像の変換係数が量子化される。予測画像の変換係数を予測信号、量子化された予測信号を量子化予測信号と呼ぶ。付加的情報利用復号部６０４では、符号化装置より伝送された付加的情報ＷＺを用いて、量子化後の変換係数の誤りが訂正される。誤り訂正された変換係数は再構成部６０５に入力される。なお、符号化装置５００と同様、変換部６０２を備えない構成も存在する。

再構成部６０５では逆量子化を行う。再構成部６０５の逆量子化では、予測信号（ここでは、予測画像の変換係数）を用いることによって確率的に符号化対象画像の信号に近くなるように処理する。この処理は、ＤＶＣ符号化では一般的な方法である（例えば、非特許文献２を参照）。従来の逆量子化を行う手段と区別するため、本明細書では、予測信号を用いない従来の逆量子化を行う手段を有する部位を逆量子化部と呼び、予測信号を用いた逆量子化を行う手段を有する部位を再構成部と呼ぶ。

図１８は、通常の逆量子化及び予測信号を用いた逆量子化の方法を説明するための図である。ここで、図１８（ａ），（ｂ）は、図１７の再構成部６０５での逆量子化、すなわち予測信号Ｙを用いた逆量子化の方法を説明するための図で、図１８（ｃ）は、図１８（ａ），（ｂ）との比較のために、予測信号Ｙを用いない逆量子化を説明するための図である。量子化とは、ある値の範囲（複数の値）に対して１つの値（量子化代表値）を割り当てる処理であるから、量子化代表値となる量子化前の値は複数ある（範囲をとる）。例えば、−２、−１、０、１、２に０を割り当てるような量子化の場合には、量子化により０となる量子化前の値は、この場合−２、−１、０、１、２の範囲となる。

通常の逆量子化（予測信号Ｙを用いない逆量子化）では、図１８（ｃ）に示すように、量子化前の値の範囲内の１つの値を量子化代表値とし、量子化された値から量子化代表値を得ることで逆量子化が行われる。前の例では、−２、−１、０、１、２のうちの１つの値として０を量子化代表値とする（０の逆量子化では０が得られる）。

それに対し、予測信号を用いた逆量子化は、量子化された値から決まる１つの量子化代表値を用いるのではなく、予測信号が量子化前の範囲にあるかどうかで値を変える。具体的には、図１８（ａ）に示すように、予測信号が量子化前の係数の値の範囲にあれば、予測信号をそのまま用いる。逆に、図１８（ｂ）に示すように、予測信号が量子化前の係数の範囲外であれば、量子化前の係数の範囲内の値のうち予測信号に最も近い値を用いる。このような処理によって、単純に量子化代表値を用いるよりも、確率的に元の値に近い値を求めることができる。

再構成部６０５により逆量子化された変換係数は、逆変換部６０６において逆変換がなされ画像が復号される。復号画像は、出力画像として出力されると共に、フレームメモリ６０７に格納される。フレームメモリ６０７に格納された画像は、後続のフレームにおいて、復号対象ブロックの予測画像の生成に用いることができる。

フレームメモリ６０７に格納された画像は外部に出力できる。勿論、外部出力の代わりに、図示しない記憶部へ出力（つまり蓄積）してもよい。

このように、符号化装置では予測信号の生成を行わずに復号装置で予測信号の生成を行うＤＶＣ符号化では、予測信号を用いた逆量子化（再構成）を行うことで復号画像の画質を向上させる処理が広く用いられている。

また、非特許文献３は、ＤＣＴ変換を行う変換部を持たない構成のＤＶＣ符号化データの復号方法が開示されている。非特許文献３の復号方法においては、付加的情報復号において、誤り訂正後の信号が０であるか１であるかの確率（ビット尤度）を、予測誤差の分布モデル（具体的にはラプラス分布）の確率密度関数を用いて求め、分布モデルの確率密度関数のパラメータ（分布パラメータ）を、予測画像を生成する際に得られる２つの動き補償信号の差の分散を用いて推定する方法が開示されている。

以下、量子化の影響を省いて簡潔に説明する。予測信号ＹとパリティＷＺから誤り訂正により復号信号Ｘを得る復号装置の処理は、
Ｘ＝誤り訂正（予測信号Ｙ、パリティＷＺ）
であり、ＸとＹは以下の関係がある。

Ｘ＝予測信号Ｙ＋予測誤差Ｎ
この関係において、非特許文献は、予測誤差Ｎの分布（＝予測誤差特性）を推定することにより、Ｘの信号の値の分布を得る方法である。

この方法では、復号装置で予測誤差特性を推定するため、符号化時にあらかじめ予測誤差特性を決定しておく方法に比べ、時間的・空間的に予測誤差特性が変化する場合において、誤り訂正の効率を高めることができる。

特開２００７−２７４０３５号公報

高村誠之、「ＤｉｓｔｒｉｂｕｔｅｄＶｉｄｅｏＣｏｄｉｎｇの動向と今後」、情報処理学会研究報告２００６−ＡＶＭ−５４Ａ．Ａａｒｏｎ，Ｒ．ＺｈａｎｇａｎｄＢ．Ｇｉｒｏｄ，"Ｗｙｎｅｒ−Ｚｉｖｃｏｄｉｎｇｏｆｍｏｔｉｏｎｖｉｄｅｏ，" Ｐｒｏｃ．ＡｓｉｌｏｍａｒＣｏｎｆｅｒｅｎｃｅｏｎＳｉｇｎａｌｓａｎｄＳｙｓｔｅｍｓ，ＰａｃｉｆｉｃＧｒｏｖｅ，ＣＡ，Ｎｏｖ．２００２Ｃ．Ｂｒｉｔｅｄｓ，Ｊ．Ａｓｃｅｎｓｏ，Ｆ．Ｐｅｒｅｉｒａ"ＳｔｕｄｙｉｎｇＴｅｍｐｏｒａｌＣｏｒｒｅｌａｔｉｏｎＮｏｉｓｅＭｏｄｅｌｉｎｇｆｏｒＰｉｘｅｌＢａｓｅｄＷｙｎｅｒ−ＺｉｖＶｉｄｅｏＣｏｉｎｇ，"ｉｎＰｒｏｃ．ＩＣＩＰ２００６．

しかし、非特許文献３で示される従来技術では、ＤＣＴ変換を行う変換部を持たない構成であるため、予測画像をＤＣＴ変換し空間的冗長性を除去するような構成においては、復号側で予測誤差特性を推定する方法を用いることができないという課題があった。

また、変換部を備える構成であっても、予測画像の変換係数である予測信号の特性が、時間的、空間的だけでなく周波数によっても異なる（変化する）ため、この変化に応じたビット尤度を算出することができない。

また、予測誤差特性の分布モデルとしてラプラス分布を用いているが、予測誤差分布の確率密度関数のグラフで、ピークからみて確率密度の減衰率が大きい状態が比較的長い裾野で続く場合（以下、尖ったピーク付近を持つ場合）には、正確に予測誤差分布をモデル化することができない。

このように、変換部を備える動画像符号化装置において、時間的に変動する特性に応じて、また、周波数により異なる特性に応じて、また、尖ったピーク付近を持つ特性に対応して、予測誤差特性を推定できないために、誤り訂正能力を高くすることができない。ＤＶＣ符号化における符号化効率は、その動画像復号装置の能力に依存するため従来技術では、符号化効率の高いＤＶＣ符号化を行うことは困難である。

そこで、本発明は、斯かる実情に鑑み、付加的情報利用復号の性能を向上し、ひいては、ＤＶＣ符号化効率を向上する動画像復号装置を提供するものである。

上記のような問題点を解決するために、本発明に係る動画像復号装置は、以下のような構成とし、特徴を有する。

上記課題を解決する本発明の動画像復号装置は、復号した画像を蓄積するフレームメモリと、前記フレームメモリに蓄積された画像から、２つの動き補償画像を生成し、生成された動き補償画像の線形和によって、復号対象となる画像の予測画像を生成する予測画像生成部と、前記予測画像を周波数変換し、予測信号を生成する第１の変換部と、前記第１の変換部により生成された前記予測信号の変換係数を量子化する量子化部と、量子化された前記変換係数を、動画像符号化装置より伝送された付加的情報を用いて、復号する付加的情報利用復号部と、前記予測画像生成部で生成された２つの動き補償画像の差分画像を算出する差分算出部と、前記差分画像を周波数変換する第２の変換部と、前記第２の変換部により周波数変換された変換係数の差分特徴量を抽出する特徴量抽出部と、抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する分布モデル推定部と、推定された差分分布モデルから復号信号分布モデルを算出し、該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが０か１かの確率を示すビット尤度を推定するビット尤度推定部と、を備え、前記付加的情報利用復号部は、前記ビット尤度推定部で推定された前記ビット尤度を用いて、復号処理を行うことを特徴とする。

また、本発明の動画像復号装置において、前記分布モデル推定部は、抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する代わりに、前記差分特徴量と前記予測信号と用いて、直接、復号信号分布モデルを算出し、前記ビット尤度推定部は、算出された該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが０か１かの確率を示すビット尤度を推定するようにしたことを特徴とする。

また、本発明の動画像復号装置において、前記分布モデル推定部は、コーシー分布とラプラス分布を含む複数の分布モデルから、推定対象とする分布モデルを選択する分布モデル選択部を備え、前記特徴量抽出部は、前記選択された分布モデルに応じた前記変換係数の差分特徴量を抽出することを特徴とする。

また、本発明の動画像復号装置において、前記特徴量抽出部は、頻度算出部と、該頻度算出部で算出された頻度データを用いて少なくとも最頻値頻度を含む頻度を抽出する頻度抽出部と、を備え、前記分布モデル推定部は、分布モデルがコーシー分布である場合、前記頻度抽出部により抽出された前記頻度に基づいて、該コーシー分布のモデルパラメータを算出することを特徴とする。

本発明に係る動画像復号装置によれば、以下に示す優れた効果を奏し得る。

上記のように構成された本発明の動画像復号装置によれば、予測画像の生成に用いた予測画像の差分をＤＣＴ変換し、変換した変換係数から分布モデルを推定し、推定した分布モデルを用いて、予測画像の変換係数である予測信号の特性が、時間的、空間的、周波数的変化に応じたビット尤度を算出し、このビット尤度を用いて、付加的情報利用復号するため、付加的情報利用復号性能を向上することができ、ひいては符号化効率を向上することができる。

また、本発明の動画像復号装置によれば、分布モデル選択部を設けることによって、種々の分布モデルから適切な分布モデルを選択し、推定し選択することができる。

また、本発明の動画像復号装置によれば、予測誤差分布の確率密度関数のグラフが尖ったピーク付近を持つ特性に対応して、予測誤差特性を推定することができ、誤り訂正能力を高くすることができる。

第１の実施形態に係る動画像復号装置の構成例を示すブロック図である。本実施形態に係る分布モデル推定部１５３の構成例を示すブロック図である。本実施形態に係る特徴量抽出部２０２の構成例を示すブロック図である。本実施形態に係るビット尤度推定部１５４の構成例を示すブロック図である。本実施形態に係る値集合算出部４０２の動作を説明するための模式図である。本実施形態に係る逆量子化値集合算出部４０３の動作を説明するための模式図である。本実施形態に係る頻度算出部３０３の動作を示すフロー図である。本実施形態に係るビット尤度推定部１５４におけるビット尤度の算出方法を説明するための模式図である。本実施形態に係る量子化予測信号の構成を示す図である。キーフレームとＷＺフレームの関係を示す図である。第２の実施形態に係る動画像復号装置の構成例を示すブロック図である。第２の実施形態に係る分布モデル推定部の構成例を示すブロック図である。第３の実施形態に係る動画像復号装置の構成例を示すブロック図である。第３の実施形態に係るビット尤度評価部の構成例を示すブロック図である。第３の実施形態に係るクラスタリング部の動作を説明する説明図である。第３の実施形態に係る推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉを示す図である。従来のＤＶＣ符号化を用いた動画像符号化装置及び動画像復号装置を示すブロック図である。通常の逆量子化及び予測信号を用いた逆量子化の方法を説明するための図である。

以下、本発明に係る動画像復号装置の実施形態について図面を参照して説明する。
図１〜図１６は、本発明の実施形態の一例であって、図中、図と同一の符号を付した部分は同一物を表わす。

＜第１の実施形態の説明＞
図１は、本発明の第１の実施形態に係る動画像復号装置の構成例を示すブロック図である。
図１で例示する動画像復号装置１００は、イントラ復号部１０１、変換部１０２、量子化部１０３、付加的情報利用復号部１０４、再構成部１０５、逆変換部１０６、フレームメモリ１０７、予測画像生成部１０８、差分算出部１５１、変換部１５２、分布モデル推定部１５３、ビット尤度推定部１５４から構成される。

動画像復号装置１００では、まずキーフレームの符号化データをイントラ復号部１０１で復号することでキーフレームが復号される。最初のＷＺフレームを復号する時点までに複数枚のキーフレームが復号される。なお、イントラ復号部１０１へ入力されるキーフレームの符号化データとキーフレーム以外の符号化データとが多重化されたデータとして入力画像を受信した場合には、入力画像から両者を分離すればよい。イントラ復号部１０１で復号されたキーフレームは、フレームメモリ１０７に格納される。

続いて、動画像復号装置１００は、ＷＺフレームの符号化データを受信する。ＷＺフレームとして符号化されたフレームは、ブロック単位で復号される。本実施形態では、ブロックサイズを４×４とする。

復号対象ブロックの符号は、付加的情報利用復号部１０４に入力される。続いて、予測画像生成部１０８により、フレームメモリ１０７に格納されたフレームを用いて予測画像（ＤＶＣブロックに対する予測画像）が生成される。例えば、図１０は、キーフレームとＷＺフレームの関係を示したものである。図１０では、ＷＺフレームとしてＷＺ１を復号する場合には、Ｋ１、Ｋ２のキーフレームが復号されている。このとき、フレームメモリ１０７に記録されたＫ１、Ｋ２の参照フレームを用いて以下のように予測画像を生成する。

まず、１）参照フレーム間の動きを探索する。ここではＫ１、Ｋ２間の動きベクトルをブロック単位で算出する。この例では、動きベクトルＭＶ０で示される動きが検出されたとする。次に、２）参照フレームと復号対象フレームの間隔に基づいて、動きの内挿もしくは外挿により、復号対象フレームと参照フレーム間の動きを推定する。ここでは、Ｋ１、Ｋ２間の動きベクトルＭＶ０の１／３をＫ１とＷＺ１間の動きベクトルＭＶ１とし、Ｋ１、Ｋ２間の動きベクトルＭＶ０の２／３をＫ２とＷＺ１間の動きベクトルＭＶ２とする。最後に、３）動き補償により、推定された動きを用いて復号対象ブロックの予測画像を参照フレームから推定する。ここでは動きベクトルＭＶ１によりＫ１から生成した画像Ｙ１と、動きベクトルＭＶ２によりＫ２から生成した画像Ｙ２の平均を（Ｙ１＋Ｙ２）／２を予測画像とする。

生成された予測画像は、変換部１０２で変換される。本実施形態では４×４の２次元ＤＣＴ変換を用いる。予測画像の変換係数（この値は以後、予測信号として扱われる）は、一方では量子化部１０３に入力され、他方では再構成部１０５に入力される。量子化部１０３では、予測画像の変換係数が量子化される。付加的情報利用復号部１０４では、動画像符号化装置より伝送された付加的情報ＷＺを用いて、量子化部１０３の出力の量子化された変換係数（＝量子化予測信号）の誤り訂正などにより、変換係数の復号が行われる。なお、付加的情報が誤り訂正符号の場合、付加的情報利用復号部１０４は誤り訂正部となる。復号された変換係数は、再構成部１０５に入力される。

誤り訂正に用いられる誤り訂正符号としては、畳み込み符号、リードソロモン符号、ターボ符号、低密度パリティ検出符号などを用いることができる。

再構成部１０５では、予測信号（ＤＶＣブロックの復号時に予測画像生成部１０８で生成し変換した予測画像）を用いた逆量子化を行う。再構成部１０５の逆量子化では、予測信号を用いることによって確率的に符号化対象画像の信号に近くなるように処理する。この処理は、図１４を用いてすでに説明したものであり、量子化代表値よりも確率的に元の値に近い値を求めるものである。図１４（ａ）に示すように予測信号（予測画像の変換係数）が量子化前の係数の範囲の中にあれば、予測信号を用いる。逆に、図１４（ｂ）に示すように予測信号が量子化前の係数の範囲外であれば、範囲の端の値で、予測信号に近い方の値を用いる。

（付加的情報利用復号部１０４の説明）
付加的情報利用復号部１０４の入力は、付加的情報と、量子化予測信号である。図９は、量子化予測信号の構成を示す図である。量子化予測信号は、ブロック単位に予測画像を変換、量子化して得られた変換係数をビットプレーン毎に並び替えて生成される。図９のとおり、量子化予測信号は、トップレベルからみると周波数ｗ、ビットプレーンｌの順に分解される構成となっている。なお、ｗは周波数を表すインデックスであり０〜１５の整数、ｌはビットプレーンを表すインデックスであり０から５の整数とする。なお、ビットプレーン０はＬＳＢのビットプレーンを意味し、ビットプレーン５はＭＳＢのビットプレーンを表す。なお、図９とは逆に、ビットプレーン、周波数の順の構成であってもかまわない。また、ビットプレーンの数を６個としたのは説明を容易にするためであり、６個である必要はない（例えば８、１０、１２個も良い）。

付加的情報利用復号部１０４では、周波数毎、ビットプレーン毎にまとめられたデータを単位（＝復号単位）として復号処理がなされる。ここで、周波数ｗ、ビットプレーンｌに対応する量子化予測信号をＳｗｌとおき、復号単位ごとに動画像復号装置に入力される付加的情報をＷＺｗｌとおく。

付加的情報利用復号部１０４は、量子化予測信号Ｓｗｌ、付加的情報ＷＺｗｌから、復号信号Ｘｗｌを復号する。本実施形態では、低周波数から高周波数（ｗ＝０からｗ＝１５の順）、ＭＳＢからＬＳＢの順（ｌ＝５からｌ＝０の順）で行うが逆の順序で復号しても構わない。

このとき、付加的情報利用復号部１０４は、復号信号Ｘｗｌの各ビットが１である確率（ビット尤度）を、ビット尤度推定部１５４から得ることにより、効率的な復号を行う。ここでいう効率的とは、付加的情報のビット量が小さい場合においても正しく復号できる可能性が高いことを意味する。

一般的な誤り訂正符号（例えば、ターボ符号や低密度パリティ検出符号）の復号では、復号対象とする信号が２値信号の列、すなわち｛０、１｝のビットの列である場合において、各ビットに対し０を−１、１を＋１に対応させた信号｛−１、１｝の復号を行う。

復号処理の途中段階では、整数｛−１、１｝が復号結果として得られるのではなく、例えば、−１の復号結果が−１．１になるなど、実数Ｒが得られる。得られた実数Ｒを下記のような閾値処理をすることによって、｛−１、１｝の復号信号Ｏを算出する。

｛−１、１｝はビット｛０、１｝に対応するので、結局出力として｛０、１｝のビットを得る。

誤り訂正符号の復号時には、復号信号Ｏが−１であるか１であるかの確からしさの情報（信頼度）を入力として設定することができる。より具体的には、復号信号Ｏが−１である確率が高い場合には、−５．４など、−１よりも小さい値を設定し、復号信号Ｏが１である確率が高い場合には、１２．５など、１よりも大きい値を設定する。復号信号Ｏが−１である確率と１である確率が等しい場合には０を設定する。復号信号Ｏが１である確率の方が０である確率よりも高いが、その確率が所定の値よりも高くない場合には０から１の間の値を設定する。このような信頼度を用いた判定は軟判定と呼ばれる。

ビットが１である確率がＰ１の場合には、軟判定用の信頼度Ｉとして、例えば、以下の対数尤度比（ＬＬＲ：ＬＯＧＬＩＫＥＬＩＨＯＯＤＲＡＴＩＯ）の値を与える。
ｌｏｇ（Ｐ１／（１−Ｐ１））
なお、対数の底は自然対数（＝２．７１８・・・）を用いる。
付加的情報利用復号部１０４は、ある周波数ｗ、ビットプレーンｌの信号が復号された時点で、ビット尤度推定部１５４に復号された信号を出力する。復号された信号は、ビット尤度推定部１５４内に備える確定ビット蓄積部４０１（後述）に蓄積される。

再構成部１０５により逆量子化された変換係数は、逆変換部１０６において逆変換がなされ画像が復号される。復号された画像は、一方では出力画像として外部に出力され、他方では、フレームメモリ１０７に格納される。

フレームメモリ１０７に格納されたフレームは、復号対象ブロックの予測画像の生成に用いることができ、また外部への出力も可能である。勿論、外部出力の代わりに、図示しない記憶部へ出力（つまり蓄積）してもよい。

以降、本実施形態の特徴部分である、予測画像生成部１０８、差分算出部１５１、変換部１５２、分布モデル推定部１５３、ビット尤度推定部１５４の動作を説明する。
（予測画像生成部１０８の説明）
予測画像生成部１０８では、フレームメモリ１０７に記録された画像から生成された２つの動き補償ブロックから予測画像を生成する。各々の動き補償ブロックをＦｆ、Ｆｂとすると、予測画像Ｐは、ＦｆとＦｂの線形和、例えば、
Ｐ＝（Ｆｆ＋Ｆｂ）／２
により算出される。上記式中の和及び除算は、画素ごとに行われる。また、画素毎に線形和の重み係数（上記では１／２を変化させても良い）。予測画像生成部１０８はまた、動き補償ブロックＦｆ、Ｆｂを差分算出部１５１に出力する。
（差分算出部１５１の説明）
差分算出部１５１は、動き補償ブロックＦｆとＦｂの差分Ｄを算出し、変換部１５２に出力する。
Ｄ＝Ｆｆ−Ｆｂ
上記式中の差は、画素ごとに行われる。

（変換部１５２の説明）
変換部１５２は、差分ＤをＤＣＴ変換し、得られた変換係数を分布モデル推定部１５３に出力する。ここでの変換は、変換部１０２と同じ変換を用いる。本実施形態では４×４の２次元ＤＣＴを用いる。
（分布モデル推定部１５３の説明）
分布モデル推定部１５３は、変換部１５２から入力された変換係数に基づいて、動き補償ブロック差分の変換係数の分布モデル（以降、差分分布モデルと呼ぶ）を推定する。図２に示すとおり、分布モデル推定部１５３は、分布モデル選択部２０１、特徴量抽出部２０２、分布パラメータ推定部２０３から構成される。

分布モデル選択部２０１は、分布モデルの種別（モデル種別）を選択する。選択する分布モデルの種類としては、本実施形態では、ラプラス分布とコーシー分布を用いる例を説明するがLevy skew alpha-stable distribution、Skew normal distributionなども有効でありこれらに限定しない。本実施形態では、ラプラス分布かコーシー分布を選択する。より具体的には、画像のサイズが所定の大きさ（例えば２５６×２５６）よりも大きい場合には、分布モデルの推定に用いられるデータ数（＝特徴量の算出に用いられるデータ数）が十分にあると考えられるのでコーシー分布を用い、画像のサイズが所定の大きさよりも小さい場合にはラプラス分布を選択する。なお、裾野の広がり具合は周波数成分によって異なる。低周波成分ほどピークの値が低く裾野が広い。逆に高周波成分は裾野が狭く急峻になる。これは、一般的に自然画像においては、高周波成分が少なく、低周波成分に比べて小さな値を取る傾向にあり、その誤差の値も小さくなる傾向が高いためこのような傾向になる。そのため、ラプラス分布とコーシー分布の選択は、画像のサイズでなく、低周波数の場合はラプラス分布、高周波数の場合はコーシー分布（またはその逆）など、周波数ごとに変更しても良い。また、分布モデル選択部２０１を備えず、全て１つの分布（例えばコーシー分布かラプラス分布）とする構成にしても良い。また、符号化データ中のヘッダ、例えば、シーケンスのヘッダ、もしくは、ピクチャのヘッダ、もしくは、ブロックをまとめた単位であるスライスのヘッダの中に、分布種別を符号化しておき、動画像復号装置１００では、復号した分布種別に基づいて、分布モデルを選択しても構わない。

以下、ラプラス分布、コーシー分布について具体的に分布モデルを説明する。下記の分布モデルは、差分分布モデル、後述する復号信号分布モデルの両者で用いられる。
（分布モデルの説明）
ラプラス分布は、モデルパラメータとして定まる所定の定数μ、σに対し、以下の関数ｆにより確率密度関数が表現される分布である。

このモデルの期待値はμ、分散は２σ×σである。

コーシー分布は、モデルパラメータとして定まる所定の定数ｘ０、γに対し、以下の関数ｆにより確率密度関数が表現される分布である。ｘ０、γは各々、位置母数、尺度母数と呼ばれる。

なお、πは円周率（約３．１４１５９２６５３４・・・）である。
コーシー分布は、ラプラス分布よりもピークの尖った確率密度関数を表現できるという特徴がある。

（特徴量抽出部２０２の説明）
特徴量抽出部２０２は、分布モデル選択部２０１で選択された分布モデルに応じて、特徴量を抽出する。図３は、特徴量抽出部２０２の構成を示すブロック図である。図３のとおり、特徴量抽出部２０２は、切替部３５１、平均値算出部３０１、分散値算出部３０２、頻度算出部３０３、頻度抽出部３０４から構成される。

切替部３５１は、分布モデル選択部２０１で選択されたモデル種別に応じて、特徴量抽出部２０２の動作を切り替える装置である。特徴量抽出部２０２は、モデル種別がラプラス分布の場合、ラプラス分布のモデルパラメータの推定に必要な特徴量を算出し、コーシー分布の場合、そのモデルパラメータに対応する特徴量を算出する。

今後、変換部１５２から出力された変換係数について、ブロックｋで算出された、周波数ｗにおける変換係数をＣｗｋと表現する。ｋは、Ｎをブロック数とした場合における０〜Ｎ−１の定数である。
（モデルがラプラス分布の場合）
平均値算出部３０１は、各変換係数の周波数ｗでの平均Ｍｗを算出する。分散値算出部３０２では、平均値算出部３０１で算出された平均値Ｍｗを用いて周波数ｗでの分散値Ｖｗを算出する。

より具体的には、

により算出する。平均値Ｍｗ、分散値Ｖｗは分布パラメータ推定部２０３に出力される。
（モデルがコーシー分布の場合）
頻度算出部３０３は、変換係数Ｃｗｋの頻度を計測する。周波数ｗにおける変換係数がＸである数を頻度ＣＯＵＮＴｗ（Ｘ）であると定義して、図７に示すフローに従って、頻度ＣＯＵＮＴｗ（Ｘ）を算出する。図７は、頻度算出部３０３の動作を示すフロー図である。なお、フロー図内に記載の「Ｓ」は、処理ステップを表す文字である。

Ｓ１０１カウンタＸに対しＸ＝０
Ｓ１０２ＣＯＵＮＴｗ（Ｘ）＝０
Ｓ１０３カウンタｋに対しｋ＝０
Ｓ１０４ＣｗｋがＸ以上、Ｘ＋１未満の場合には（Ｓ１０４；Ｙ）、Ｓ１０５に遷移する。そうでない場合には（Ｓ１０４；Ｎ）、Ｓ１０６に遷移する。

Ｓ１０５ＣＯＵＮＴｗ（Ｘ）を１だけインクリメントする。

Ｓ１０６ｋを１だけインクリメントする。

Ｓ１０７ｋがＮ−１以下なら（Ｓ１０７；Ｙ）、Ｓ１０４に遷移し、ｋがＮ以上ならば（Ｓ１０７；Ｎ）、Ｓ１０８に遷移する。

Ｓ１０８Ｘを１だけインクリメントする。

Ｓ１０９Ｘが１２８以下なら（Ｓ１０９；Ｙ）、Ｓ１０２に遷移し、Ｘが１２８より大きければ（Ｓ１０９；Ｎ）、処理を終了する。

頻度抽出部３０４は、各周波数ｗにおいてＣＯＵＮＴｗ（Ｘ）が最大となる最頻値Ｘｗの値を求め、分布パラメータ推定部２０３に出力する。さらに、頻度抽出部３０４は、最頻値Ｘｗとなる場合の最頻値頻度Ｋｗを求める。なお、最頻値頻度Ｋｗは、ブロックの数Ｎで割ることにより正規化された値を用いる。

Ｋｗ＝ＣＯＵＮＴｗ（Ｘｗ）／Ｎ
求めた最頻値頻度Ｋｗは分布パラメータ推定部２０３に出力する。
頻度抽出部３０４は、最頻値頻度Ｋｗの代わりに、０のときの頻度Ｋ０、ｋのときの頻度Ｋ１、−ｋのときの頻度Ｋ２を、
Ｋ０＝ＣＯＵＮＴｗ（０）／Ｎ
Ｋ１＝ＣＯＵＮＴｗ（ｋ）／Ｎ
Ｋ２＝ＣＯＵＮＴｗ（-ｋ）／Ｎ
により求め、分布パラメータ推定部２０３に出力しても良い。なお、ｋは所定の定数、例えば１を用いる。
また、Ｋｗ、Ｋ０、Ｋ１、Ｋ２に限らず、最頻値周辺もしくは０周辺の複数の頻度を求め、分布パラメータ推定部２０３に出力しても構わない。
なお、モデル種別がラプラス分布及びコーシー分布においても、モデル種別に応じて、特徴量抽出部２０２は、変換係数Ｃｗｋの１つ以上のモーメント（１次モーメントの平均、２次モーメントの分散、もしくはより高次のモーメント）、もしくは、変換係数Ｃｗｋの頻度を抽出することが好適である。
（分布パラメータ推定部２０３の説明）
分布パラメータ推定部２０３は、分布モデルの関数を定める分布パラメータを算出する。分布モデルとしてラプラス分布を用いる場合には、分布パラメータ推定部２０３は、平均値Ｍｗ、分散値Ｖｗを用いて、以下のように周波数ｗ毎にモデルパラメータを推定する。

分布モデルとしてコーシー分布を用いる場合には、分布パラメータ推定部２０３は、最頻値Ｘｗと、最頻値頻度Ｋｗを用いて、以下のように周波数ｗ毎にモデルパラメータを推定する。

ｘ０ｗ＝Ｘｗ
γｗ＝π／Ｋｗ
なお、頻度抽出部３０４より、最頻値頻度Ｋｗではなく、３点の頻度Ｋ０、Ｋ１、Ｋ２が与えられた場合には、以下の式によりモデルパラメータγｗを得る。
γｗ＝π×ｋ×ｋ／｛（１／Ｋ１＋１／Ｋ２）／２−１／Ｋ０｝
この場合、１点の頻度Ｋｗではなく、３点の頻度Ｋ０、Ｋ１、Ｋ２から求めるため、尺度母数γの推定精度が高くなる。
Ｋｗ、Ｋ０、Ｋ１、Ｋ２以外にも、３点以上の頻度が頻度抽出部３０４から入力されれば、さらに高精度のγの推定が可能である。なお、コーシー分布の分布パラメータの算出方法は上記に限定しない。すなわち、位置母数ｘ０ｗを０と仮定する場合や３点よりも多い場合には、ニュートン法や最小二乗法などを用いてγを推定することが可能であるが、ここでは説明しない。
なお、モデル種別がラプラス分布及びコーシー分布においても、モデル種別に応じて、変換係数Ｃｗｋの１つ以上のモーメント、もしくは、変換係数Ｃｗｋの頻度からモデルパラメータを推定することが好適である。
（ビット尤度推定部１５４の説明）
ビット尤度推定部１５４は、付加的情報利用復号部１０４に入力される量子化予測信号Ｓｗｌを復号して得られる、復号信号Ｘｗｌの各ビットが０であるか１であるかの確率（０以上１以下の実数）を算出するものである。具体的には、周波数成分ｗ、ビットプレーンｌの量子化予測信号におけるブロックｋのビットが１である確率Ｐ１を出力する。

ビット尤度推定部１５４には、変換部１０２から予測信号である変換係数Ｃｗｋが入力され、付加的情報利用復号部１０４から復号された信号が入力され、分布モデル推定部１５３から、モデル種別とモデルパラメータが入力される。

図８は、ビット尤度推定部１５４におけるビット尤度の算出方法を説明するための模式図である。

図８の（ａ）（ｂ）のグラフは、ある周波数成分ｗ、ブロックｋの復号信号Ｘｗｌのブロックｋのビットが確率的にどのように分布するかを示す確率密度関数Ｐ（ｘ）である。復号信号ｘと量子化予測信号ｙ、予測誤差ｎの関係を
ｘ＝ｙ＋ｎ
とあらわすと、通常予測誤差ｎは０を中心として分布すると考えられるため、ｘの期待値Ｅ（ｘ）は、量子化予測信号ｙに一致する。従って、確率密度関数Ｐ（ｘ）の極大値は、予測信号Ｃｗｋと一致する。

以降、ｘの確率密度関数Ｐ（ｘ）が与えられた場合に、ｘの各ビットが０であるか１であるかの確率の推定方法について説明する。

まず、説明の準備として、確率密度関数Ｐ（ｘ）の値域をΩであらわす。本実施形態の場合、−３２以上３１以下の整数とする。ｘを６ビット２進数として表すと、ＬＳＢからＭＳＢの各ビットがｂ０、ｂ１、ｂ２、ｂ３、ｂ４、ｂ５であるとして表現することができる。また、
ｘ＝ｂ５×３２＋ｂ４×１６＋ｂ３×８＋ｂ２×４＋ｂ１×２＋ｂ０×１−３２
を満たす。

なお、Ωの値域を６ビットで表現できる−３２以上、３１以下の整数としたのは説明上の都合であり、実際には例えば１２ビット整数の−２０４８以上、２０４７以下のようなより大きな値域を用いることが適当である。

ｘが確率密度関数Ｐ（ｘ）から得られた値である場合、ｘのＭＳＢすなわち、ｂ５が１である確率と０である確率は以下のように求めることができる。図８（ａ）において、ｂ５が１である区間は区間（ａ）で示した区間のうち網目の領域であり、ｂ５が０である区間は斜線領域である。ｘが１である確率は、確率密度関数の網目領域の面積に比例し、ｘが０である確率は、確率密度関数の斜線領域の面積に比例する。
よって、ｂ５が１になる確率は、
網目領域の面積／（網目領域の面積＋斜線領域の面積）
で推定され、逆に、ｂ５が０になる確率は、
斜線領域の面積／（網目領域の面積＋斜線領域の面積）
で推定される。

このように、値ｘがある確率密度関数Ｐ（ｘ）から与えられたものである場合には、確率密度関数を利用して、ｘをビット列として表現した場合におけるあるビットが０か１になる確率（ビット尤度）を推定することができる。

また、図８（ｂ）は、特に、ｂ５が１であると分かっている場合におけるｂ４のビット尤度（条件付確率）を推定する場合を示す図である。ｂ５が１であるから、区間（ｂ）で示すように、ｘが黒領域で示される区間にあることが確定している。また、ｂ４が１である区間が編線領域、ｂ４が０である領域が斜線領域となる。ｂ４が１になる確率は、グラフより、
網目領域の面積／（網目領域の面積＋斜線領域の面積）
で推定され、逆に、ｂ４が０になる確率は、
斜線領域の面積／（網目領域の面積＋斜線領域の面積）
で推定される。ｂ５が１であると分かっている分、より正確にビット尤度の推定が可能である。

上記のようにビット尤度を推定するためには、分布モデルを示す確率密度関数と、ビットが０となる区間と、ビットが１となる区間が必要になる。

図４はビット尤度推定部１５４の構成を示すブロック図である。ビット尤度推定部１５４は、確定ビット蓄積部４０１、値集合算出部４０２、逆量子化値集合算出部４０３、値領域面積算出部４０４、モデル分布値算出部４０５、確率算出部４０６から構成される。

確定ビット蓄積部４０１は、付加的情報利用復号部１０４から伝達される、量子化予測信号のうち、すでに復号済みのビットを確定ビットとして蓄積する。量子化予測信号は、ブロック毎に周波数変換されビットプレーン分解された信号であるから、周波数ｗ、ビットｂ、ブロックｋのビットの集合である。本実施形態では、ビットプレーンの深度は６、すなわち、ビット位置としてはＬＳＢから順にｂ０からｂ５の６個があるものとする。

より具体的には、ビットプレーンｌ（ｌ＝０、１、２、３、４、５の整数）が復号された時点で、ｌ以上のビットプレーンに対応する。量子化予測信号のビット列Ｘｗｌを蓄積する。

値集合算出部４０２は、ある周波数ｗ、ブロックｋ、ビット位置ｂが与えられた場合における、ビット位置ｂにおける値Ｘが０である値の集合と、Ｘが１である値の集合を求める。ビット位置はｂ０、ｂ１、ｂ２、ｂ３、ｂ４、ｂ５のいずれかである。

図５は、値集合算出部４０２の動作を説明するための模式図である。図５に示すとおり、値集合算出部４０２には、求めるビット位置ｂと、確定ビットが与えられる。図のようにビット位置ｂがｂ３である場合、ＭＳＢから復号する場合には、すでにｂ５、ｂ４が確定している。この確定ビットの値は、周波数ｗ、ブロックｋにより異なるが、ここでは説明のために図のとおり２進数表示で１１であるとする。

このとき、値集合算出部４０２は、２進数表示で、値が１１Ｘｘｘｘ（ｘは０か１の整数）で表される集合を、Ｘ＝０の場合、とＸ＝１の場合について求める。

例えば、Ｘ＝１である集合は、２進数表示で１１１ｘｘｘ（ｘは０か１の整数）である。図８のとおり、求められたＸが１である値の集合Ｘ１と、Ｘが０である値の集合Ｘ０は、逆量子化値集合算出部４０３に出力される。

逆量子化値集合算出部４０３は、入力された集合Ｘ１、Ｘ０から、ｙを量子化した場合にＸ１となるｙの集合Ｙ１、ｙを量子化した場合にＸ０となるｙの集合Ｙ０を求める。このときの量子化方法は、量子化部１０３と同じとする。

量子化部１０３における量子化が、量子化ステップをＱＰとした場合において
Ｘ＝（Ｙ＋ＯＦＦＳＥＴ）／／ＱＰ
であらわされる場合について説明する。なおＯＦＦＳＥＴは所定の定数であり、ＯＦＦＳＥＴ＝ＱＰ／２（もしくはＱＰ／３）が好ましいとされている。なお、／／は、切捨て整数化により整数化する除算である。

この場合、量子化して値ｘとなる値ｙは、
ｙ＝ｘ×ＱＰ−ＯＦＦＳＥＴ、ｘ×ＱＰ−ＯＦＦＳＥＴ＋１、・・・、ｘ×ＱＰ−ＯＦＦＳＥＴ＋ＱＰ−１となる。

集合Ｘ１の要素をＸ１ｍ、ｍを０〜ｎ−１で表した場合においては、求める集合Ｙ１は、ｎ個の区間｛ＭＩＮｍ、ＭＡＸｍ｝で表現できる。
但し、
ＭＩＮｍ＝Ｘ１ｍ×ＱＰ−ＯＦＦＳＥＴ
ＭＡＸｍ＝Ｘ１ｍ×ＱＰ−ＯＦＦＳＥＴ＋ＱＰ−１
ｍは０〜ｎ−１である。

集合Ｘ０が与えられた場合も同様に、
ＭＩＮｍ＝Ｘ０ｍ×ＱＰ−ＯＦＦＳＥＴ
ＭＡＸｍ＝Ｘ０ｍ×ＱＰ−ＯＦＦＳＥＴ＋ＱＰ−１
からなる区間｛ＭＩＮｍ、ＭＡＸｍ｝として集合Ｙ０を求めることができる。求めた逆量子化値集合Ｙ０、Ｙ１は値領域面積算出部４０４に出力される。

分布モデル値算出部４０５は、ある周波数成分ｗ、ブロックｋの予測信号Ｃｗｋが復号された場合に、復号信号がどのように分布するかを示す確率密度関数Ｐ（ｘ）を定め、入力値ｘでの値Ｐ（ｘ）を出力する。以降、復号信号の分布は、予測信号を中心とする予測誤差の特性に応じた広がりを持つ分布であり、復号信号分布モデルと呼ぶ。

まず、入力された予測信号Ｃｗｋ、分布種別、モデルパラメータからＰ（ｘ）を定める。入力されたモデル種別がラプラス分布の場合には、入力された変換係数Ｃｗｋに対し、確率密度関数Ｐ（ｘ）を
平均Ｍｗｋ＝Ｃｗｋ
分散 σ_ｗｋ＝α×σ_ｗ
に従う式（１）として定める。ここで、αは、所定の定数であり、差分分布モデルの分布の広がり具合σ_ｗと、復号信号分布モデルの分布の広がり具合σ_ｗｋの関係を示す。

入力されたモデル種別がコーシー分布の場合には、入力された変換係数Ｃｗｋに対し、
ｘ０ｗｋ＝Ｃｗｋ
γｗｋ＝β×γｗ
である。βは所定の定数である。αと同様、差分分布モデルの分布の広がり具合と復号信号分布モデルの分布の広がり具合の関係を示す値であり、あらかじめ適当な値を求めておく。

確率密度関数Ｐ（ｘ）を定めた時点で、分布モデル値算出部４０５は、入力値ｘにおける値Ｐ（ｘ）を求め、値領域面積算出部４０４に出力する。

値領域面積算出部４０４は、分布モデル値算出部４０５を用いて、分布モデルが、逆量子化値集合Ｙ１（あるいはＹ０）の区間となる領域の面積を求める。求める面積は、図８の説明における、網目領域の面積及び斜線領域の面積に相当する。

具体的には、分布モデル値算出部４０５にＹ０、Ｙ１の要素ｙ０ｌ（ｌ＝０〜ｎ）、ｙ１ｌ（ｌ＝０〜ｎ）を入力し、その出力値Ｐ（ｙ０ｌ）、Ｐ（ｙ１ｌ）の和を算出する。式で示すと

となる。ＳＵＭ０、ＳＵＭ１は、値集合算出部４０２において値集合Ｘ１、Ｘ０を算出する際に対象としたＸが０である確率に比例する面積、Ｘが１である確率に比例する面積である。得られたＳＵＭ０、ＳＵＭ１は確率算出部４０６に出力される。

確率算出部４０６は、確率密度関数の区間面積ＳＵＭ０、ＳＵＭ１から、以下の式によりＸが０である確率Ｐ０とＸが１である確率Ｐ１を算出する。

Ｐ０＝ＳＵＭ０／（ＳＵＭ０＋ＳＵＭ１）
Ｐ１＝ＳＵＭ１／（ＳＵＭ０＋ＳＵＭ１）
確率算出部４０６は、ビット尤度推定部１５３の入力としてある周波数ｗ、ブロックｋ、ビット位置ｂが与えられた場合における、ビット位置ｂにおける値Ｘが１である確率Ｐ１を付加的情報利用復号部１０４に出力する。なお、Ｐ１＝１−Ｐ０の関係があるため確率Ｐ１ではなく確率Ｐ０を出力しても構わない。

＜第２の実施形態の説明＞
上記分布モデル推定部１５３において、差分分布モデルを求め、差分分布モデルから復号信号分布モデルを推定する方法について説明したが、変換係数と、予測信号とから、直接、復号信号分布モデルを求める分布モデル推定部を備えた動画像復号装置ついて説明する。
図１１は、変換係数、予測信号から、直接、復号信号分布モデルを求める第２の実施形態の動画像復号装置の構成を示す図である。
図１で例示する動画像復号装置１３００は、イントラ復号部１０１、変換部１０２、量子化部１０３、付加的情報利用復号部１０４、再構成部１０５、逆変換部１０６、フレームメモリ１０７、予測画像生成部１０８、差分算出部１５１、変換部１５２、分布モデル推定部１３５３、ビット尤度推定部１５４から構成される。

図１２は、本実施形態の分布モデル推定部１３５３の構成を示すブロック図である。
分布モデル推定部１３５３は、分布モデル選択部２０１、特徴量抽出部２０２、分布パラメータ推定部１４０３を備える。
分布パラメータ推定部１４０３は、分布種別に応じた特徴量と、予測信号Ｃｗｋを入力として、復号信号分布モデルのモデルパラメータを求める。
分布モデルとしてラプラス分布を用いる場合には、分布パラメータ推定部１４０３は、分散値Ｖｗを用いて、以下のように周波数ｗ、ブロックｋ毎にモデルパラメータを推定する。

分布モデルとしてコーシー分布を用いる場合には、分布パラメータ推定部１４０３は、最頻値Ｘｗと、最頻値頻度Ｋｗを用いて、以下のように周波数ｗ、ブロックｋ毎にモデルパラメータを推定する。
ｘ０ｗｋ＝Ｃｗｋ
γｗｋ＝β×π／Ｋｗ
推定したモデルパラメータは、ビット尤度推定部１５４に出力される。復号信号分布モデルのモデルパラメータが入力された場合、ビット尤度推定部１５４内の分布モデル値算出部４０５の一部動作を省略する。具体的には、ある周波数成分ｗ、ブロックｋの予測信号Ｃｗｋが復号された場合に、復号信号がどのように分布するかを示す確率密度関数Ｐ（ｘ）を定めることは、分布パラメータ推定部１４０３により既に行われているため省略する。ビット尤度推定部１５４のその他の動作は、既に説明したとおりである。

以上説明したように、本発明の動画像復号装置１００、１３００では、予測画像の生成に用いた予測画像の差分をＤＣＴ変換し、変換した変換係数から分布モデルを推定し、推定した分布モデルを用いて、ビット尤度を算出することによって、付加的情報利用復号の性能を向上させる。これにより、符号化効率を向上する。

＜第３の実施形態の説明＞
第１の実施形態又は第２の実施形態の動画像復号装置に、さらにビット尤度推定部１５４の動作の良さを評価するビット尤度評価部１５６１を追加した動画像復号装置について説明する。
図１３は、第３の実施形態の動画像復号装置の構成を示すブロック図である。図１３で例示する動画像復号装置１５００は、イントラ復号部１０１、変換部１０２、量子化部１０３、付加的情報利用復号部１０４、再構成部１０５、逆変換部１０６、フレームメモリ１０７、予測画像生成部１０８、差分算出部１５１、変換部１５２、分布モデル推定部１３５３、ビット尤度推定部１５４、ビット尤度評価部１５６１から構成される。１５０１は、ビット尤度、１５０２は、量子化予測信号、１５０３は、復号信号を意味し、各々、ビット尤度評価部１５６１に入力される。

図１４は、ビット尤度評価部１５６１の構成を示すブロック図である。ビット尤度評価部１５６１は、ビット尤度格納部１６０１、量子化予測信号格納部１６０２、誤り訂正後信号格納部１６０３、誤り率推定部１６０４、推定誤り率ソート部１６０５、クラスタリング部１６０６、クラスタ誤り率推定部１６０７、クラスタ誤り率測定部１６０８、ビット尤度評価値算出部１６０９から構成される。

ビット尤度格納部１６０１は、周波数成分ｗ、ビットプレーンｌの量子化予測信号におけるビットが１である確率Ｐ１を格納する。
予測信号格納部１６０２は、周波数成分ｗ、ビットプレーンｌの量子化予測信号Ｓｗｌを格納する。
誤り訂正後信号格納部１６０３は、周波数成分ｗ、ビットプレーンｌの復号信号Ｘｗｌを格納する。
誤り率推定部１６０４は、ビット尤度格納部１６０１に格納されたビット尤度と、量子化予測信号格納部１６０２に格納された量子化予測信号を用いて、周波数成分ｗ、ビットプレーンｌの量子化予測信号Ｓｗｌの誤り率を推定する。

誤り率とは、付加的情報利用復号部１０４において量子化予測信号Ｓｗｌが訂正される割合である。すなわち、量子化予測信号Ｓｗｌのビットが０である場合に１に訂正される数と量子化予測信号のビットが１である場合の数の和である誤り数を、量子化予測信号Ｓｗｌの全体のビット数で割った値である。
各ビットにおける誤り率の推定値は、量子化予測信号のあるビットが０である場合に１に復号される確率Ｐ１、量子化予測信号のあるビットが１である場合に０に復号される確率１−Ｐ１である。従って、誤り率推定部１６０４はビット毎に、下記のように推定誤り率Ｒｗｌｋを推定し格納する。
Ｒｗｌｋ＝Ｐ１（Ｓｗｌｋ＝０の場合）
１−Ｐ１（Ｓｗｌｋ＝１の場合）

推定誤り率ソート部１６０５は、誤り率推定部で求められたＲｗｌｋを誤り率の順にソートする。ソートの順は、誤り率の大きい方から小さい方に順序でも、その逆でも構わないが、ここでは小さい方から大きい方にソートする。推定誤り率ソート部１６０５は、Ｒｗｌｋをソートする際、Ｒｗｌｋとその位置を示すインデックスｋを組｛Ｒｗｌｋ、ｋ｝をソートする。

クラスタリング部１６０６は、推定誤り率ソート部１６０５でソートされた推定誤り率とインデックスの組｛Ｒｗｌｋ、ｋ｝を、推定誤り率Ｒｗｌｋを用いてクラスタリングする。
図１５は、クラスタリング部１６０６の動作を説明する図である。図１５に示すように、クラスタリング部１６０６は、推定誤り率Ｒｗｌｋの小さい順からＮ１個、Ｎ２個、Ｎ３個・・・、Ｎｍ個と抽出することにより、クラスタ１からクラスタｍまでのｍ個にクラスタリングする。ここでｍは１以上の所定の定数とする。
誤り率が低い場合の方が、要素の数に対して発生する誤り数が小さいため、正確な誤り率を推定するにはより多くの要素が必要である。このことを考慮して、各クラスタの要素の個数については、ｉ＜ｊとなるクラスタｉ、クラスタｊについて、Ｎｉ＞＝Ｎｊとなることが望ましい。すなわち、推定誤り率の小さいクラスタの方が、推定誤り率が大きいクラスタよりも、クラスタの要素の個数が多い方が好ましい。

本実施形態では、ブロックの数Ｎを用いて、例えば、
Ｎ１＝Ｎ／２
Ｎ２＝Ｎ／４
Ｎ３＝Ｎ／８
Ｎ４＝Ｎ／１６
Ｎ５＝Ｎ／１６
と定める。すなわち、隣接するクラスタにおいて、推定誤り率の大きいクラスタの要素が、推定誤り率の小さいクラスタの要素の半分になるように定める。
漸化式で示すと、以下の式で示される。
Ｎ１＝Ｎ／２
Ｎｉ＋１＝Ｎｉ／２（ｉ＜ｍ）
Ｎｍ＝Ｎ−（Ｎ１＋Ｎ２＋・・・＋Ｎｍ−１）

クラスタ誤り率推定部１６０７は、クラスタリング部１６０６でクラスタリングされたクラスタ毎に、誤り率推定部１６０４で求められた推定誤り率の平均値を算出する。具体的には、クラスタ誤り率推定部１６０７に備える図示しない加算部を用いて、クラスタｉに属するインデックスのＲｗｌｋを全て加算し、クラスタ誤り率推定部１６０７に備える図示しない除算部を用いて、クラスタの要素数で割ることによりクラスタ毎の推定誤り率ＥｓｔＲｗｌｉを算出する。
上記計算は、クラスタｉに属するインデックスの集合をΩｉで表すと、ｋ∈｛Ωｉ｝について加算を意味するΣを用いて、
ＥｓｔＲｗｌｉ＝ΣＲｗｌｋ／Ｎｉｋ∈｛Ωｉ｝
と表現できる。
算出された推定誤り率ＥｓｔＲｗｌｉは、ビット尤度評価値算出部１６０９に出力される。

クラスタ誤り率測定部１６０８は、クラスタリング部１６０６でクラスタリングされたクラスタ毎に、量子化予測信号格納部１６０２に格納された量子化予測信号と、誤り訂正後信号格納部１６０３に格納された復号信号を用いて、実際の誤り率を測定する。具体的には、クラスタ誤り率推定部１６０７に備える図示しない誤り数測定部を用いて、クラスタｉに属するインデックスの量子化予測信号Ｓｗｌｋと復号信号Ｘｗｌｋが一致しない場合の数（量子化予測信号Ｓｗｌが訂正される数、誤り数）を測定する。一致しない場合とは、１が０に、もしくは、０が１に訂正された場合であり誤り数ＥＲＲｉを意味する。続いて、クラスタ誤り率推定部１６０７に備える図示しない除算部を用いて、誤り数ＥＲＲｉをクラスタの要素数で割り、クラスタ毎の誤り率ＲｅａｌＲｗｌｉを算出する。
式では以下のように表現できる。

ＲｅａｌＲｗｌｉ＝ＥＲＲｉ／Ｎｉ
算出された測定誤り率ＲｅａｌＲｗｌｉは、ビット尤度評価値算出部１６０９に出力される。
図１６は、推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉをクラスタ毎に並べて示したものである。各クラスタにおいて、推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉが近いほど、精度の高いビット尤度推定が行えたと言える。
ビット尤度評価値算出部１６０９は、推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉの差を、クラスタｉ毎に算出し、ビット尤度評価値Ｅｗｌを算出する。具体的には、
Ｅｗｌ＝Σ（｜ＥｓｔＲｗｌｉ−ＲｅａｌＲｗｌｉ｜／ＲｅａｌＲｗｌｉ）
により求める。なお、上記式において、Σはｉに関する加算、｜ｘ｜はｘの絶対値を求める関数を表す。またＲｅａｌＲｗｌｉ＝０となるｉについては｜ＥｓｔＲｗｌｉ−ＲｅａｌＲｗｌｉ｜／ＲｅａｌＲｗｌｉを０として加算する。

一般に、測定誤り率ＲｅａｌＲｗｌｉが小さい場合の方が誤り率の推定精度が高い必要がある。そのため上記式では、推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉの差を、測定誤り率ＲｅａｌＲｗｌｉで割ることにより、測定誤り率ＲｅａｌＲｗｌｉが小さいほど、差の重みが大きくなるように調整している。
なお、推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉの差が大きいほど、Ｅｗｌが大きくなるような関数であれば、ビット尤度評価値の算出は、上記式に限る必要はない。

なお、ビット尤度評価値算出部１６０９は、ビット尤度評価値としてスカラー値ではなく、ベクトル値を出力しても良い。より具体的には、推定誤り率ＥｓｔＲｗｌｉと測定誤り率ＲｅａｌＲｗｌｉの差を、クラスタｉ毎に算出し、その差ＤＩＦＦｉをベクトルとして出力する。
ＤＩＦＦｉ＝｜ＲｅａｌＲｗｌｉ−ＥｓｔＲｗｌｉ｜
この場合も、ＲｅａｌＲｗｌｉで割ることにより、正規化してもかまわない。
ＤＩＦＦｉ＝｜ＲｅａｌＲｗｌｉ−ＥｓｔＲｗｌｉ｜／ＲｅａｌＲｗｌｉ
但し、ＲｅａｌＲｗｌｉ＝０のときはＤＩＦＦｉ＝０とする。
以上説明したように、本発明の動画像復号装置１５００では、ビット尤度評価部１５６１を設けることにより、ビット尤度推定部１５４の動作の良さを評価することができる。

尚、本発明の画像復号装置は、上述の図示例にのみ限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々変更を加え得ることは勿論である。

１００、１３００、１５００動画像復号装置
１０１イントラ復号部
１０２変換部
１０３量子化部
１０４付加的情報利用復号部
１０５再構成部
１０６逆変換部
１０７フレームメモリ
１０８予測画像生成部
１５１差分算出部
１５２変換部
１５３、１３５３分布モデル推定部
１５４ビット尤度推定部
２０１分布モデル選択部
２０２特徴量抽出部
２０３、１４０３分布パラメータ推定部
３０１平均値算出部
３０２分散値算出部
３０３頻度算出部
３０４頻度抽出部
３５１切替部
４０１確定ビット蓄積部
４０２値集合算出部
４０３逆量子化値集合算出部
４０４値領域面積算出部
４０５分布モデル値算出部
４０６確率算出部
５００動画像符号化装置
５０１イントラ符号化部
５０２変換部
５０３量子化部
５０４付加情報生成部
５０５フレーム振り分け部
６００動画像復号装置
６０１イントラ復号部
６０２変換部
６０３量子化部
６０４付加的情報利用復号部
６０５再構成部
６０６逆変換部
６０７フレームメモリ
６０８予測画像生成部
１５０１ビット尤度
１５０２量子化予測信号
１５０３復号信号
１５６１ビット尤度評価部
１６０１ビット尤度格納部
１６０２量子化予測信号格納部
１６０３誤り訂正後信号格納部
１６０４誤り率推定部
１６０５推定誤り率ソート部
１６０６クラスタリング部
１６０７クラスタ誤り率推定部
１６０８クラスタ誤り率測定部
１６０９ビット尤度評価値算出部

Claims

復号した画像を蓄積するフレームメモリと、
前記フレームメモリに蓄積された画像から、２つの動き補償画像を生成し、生成された動き補償画像の線形和によって、復号対象となる画像の予測画像を生成する予測画像生成部と、
前記予測画像を周波数変換し、予測信号を生成する第１の変換部と、
前記第１の変換部により生成された前記予測信号の変換係数を量子化する量子化部と、
量子化された前記変換係数を、動画像符号化装置より伝送された付加的情報を用いて、復号する付加的情報利用復号部と、
前記予測画像生成部で生成された２つの動き補償画像の差分画像を算出する差分算出部と、
前記差分画像を周波数変換する第２の変換部と、
前記第２の変換部により周波数変換された変換係数の差分特徴量を抽出する特徴量抽出部と、
抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する分布モデル推定部と、
推定された差分分布モデルから復号信号分布モデルを算出し、該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが０か１かの確率を示すビット尤度を推定するビット尤度推定部と、
を備え、
前記付加的情報利用復号部は、前記ビット尤度推定部で推定された前記ビット尤度を用いて、復号処理を行うことを特徴とする動画像復号装置。
前記分布モデル推定部は、抽出された前記差分特徴量を用いて、差分分布モデルのパラメータを推定し、差分分布モデルを算出する代わりに、前記差分特徴量と前記予測信号と用いて、直接、復号信号分布モデルを算出し、前記ビット尤度推定部は、算出された該復号信号分布モデルを用いて、付加的情報利用復号手段で復号される復号信号の各ビットが０か１かの確率を示すビット尤度を推定するようにしたことを特徴とする請求項１に記載の動画像復号装置。
前記分布モデル推定部は、コーシー分布とラプラス分布を含む複数の分布モデルから、推定対象とする分布モデルを選択する分布モデル選択部を備え、
前記特徴量抽出部は、前記選択された分布モデルに応じた前記変換係数の差分特徴量を抽出することを特徴とする請求項１または請求項２に記載の動画像復号装置。
前記特徴量抽出部は、頻度算出部と、該頻度算出部で算出された頻度データを用いて少なくとも最頻値頻度を含む頻度を抽出する頻度抽出部と、を備え、
前記分布モデル推定部は、分布モデルがコーシー分布である場合、前記頻度抽出部により抽出された前記頻度に基づいて、該コーシー分布のモデルパラメータを算出することを特徴とする請求項１から請求項３のいずれか１項に記載の動画像復号装置。