<予測符号化の説明>
従来から、動画像符号化方式として、MPEG(Moving Picture Experts Group)やH.26xシリーズなどの方式が知られている。これらの方式では、動き補償技術を用いて符号化対象画像の予測画像を生成し、符号化対象画像と予測画像の差分を符号化することによって動画像を符号化する。このような符号化方式は予測符号化方式と呼ばれる。
以下、予測符号化を行う装置及びその復号を行う装置の一般的な構成を説明する。今、Xを符号化対象信号、YをXの予測信号、NをXとYの予測誤差とすると、
X=Y+N
である。予測符号化の符号化装置では、予測信号Yを生成し予測誤差N(=X−Y)を算出した上で、予測信号Yを生成するための情報と予測誤差Nを符号化する。
復号装置では、まず予測信号を生成するための情報から予測信号Yを復号し、さらに予測誤差Nを復号する。続いて、得られた予測信号Yと予測誤差Nを下式のように加算することで、符号化対象信号Xを復号する。
X=Y+N
<DVCの説明>
ところで、近年、新しい動画像符号化方式としてDistributed Video Coding(以下DVC符号化)と呼ばれる符号化方式が知られるようになった(例えば、非特許文献1及び特許文献1を参照)。DVC符号化は、誤り訂正技術を用いると一定の誤りのある符号を訂正することが可能であるという原理を利用したものである。
以下、DVC符号化を行う装置及びその復号を行う装置の一般的な構成を説明する。予測符号化の説明と同様、符号化対象信号をX、Xの予測信号をY、XとYの予測誤差をNとすると、
X=Y+N
である。
DVC符号化の符号化装置では、予測信号Yの生成を行わず、復号装置で予測信号Yを生成する。DVC符号化の特徴は、符号化装置で予測信号Yを生成しない分、符号化に必要な演算量が小さいことである。符号化装置では、予測信号Yを生成しないことから、予測誤差Nを求めることはできない。そこでDVC符号化では、予測誤差Nを符号化する代わりに、符号化対象信号Xの誤り訂正用の情報を符号化する。
誤り訂正用の情報としては、一般の誤り訂正符号が利用できる。誤り訂正符号には、畳み込み符号、ターボ符号、低密度パリティ検出符号などがあるが、DVC符号化にはそのいずれもが利用可能である。DVC符号化では誤り訂正用の情報を圧縮に使うが、その使い方は、伝送や蓄積など通常の誤り訂正符号の使い方とは異なる。
誤り訂正符号の通常の使い方(例えば信号Xの伝送)では、誤り訂正符号化により信号XのパリティWZを生成した後、元の信号XとパリティWZの両者を伝送する。受信側では、信号XとパリティWZの組を受け取り、それらの組から誤りを訂正することで誤りのない信号Xが得られる。
それに対し、DVC符号化では、信号Xを圧縮対象とすると、信号XのパリティWZを生成後、信号X自体は破棄し、パリティWZのみを伝送する。一般に、パリティWZは、信号Xよりも情報量が小さいため、信号XをパリティWZに置き換えることで符号量を削減できる。
DVC符号化の手順を式で記述すると、
WZ=パリティ生成(X)
である。
DVC符号化の復号装置では、まず、DVC符号化による符号化データとは異なる、復号装置に入力される情報(例えば前後のフレームから予測した動きベクトルなど)を用いて、信号Xの予測値(予測信号Y)を生成する。予測信号Yは、Xに誤りNが載った信号とみなすことができることから、パリティWZを用いて予測信号Yの誤りを訂正することで、Xを再生することができる。
DVC符号化の復号の手順を式で記述すると、
X=誤り訂正(Y,WZ)
である。
<コセットを用いたDVCの説明>
図5は、DVC符号化の別の方式を説明するための図である。図5に示すDVC符号化では、符号化の対象となる値の定義域をある部分集合の組に分解し、符号化対象となる値の属する部分集合のインデックスを送ることによって符号化を行う。本明細書では、このようなDVC符号化を、コセットを用いたDVCと呼ぶ。
図5(A)に示すように、符号化の対象となる値の定義域が4つの部分集合A、B、C、Dに分割されている場合を例に挙げて、定義域中の信号Xの符号化を説明する。信号Xの符号化では、まずXがどの部分集合に属するかを判定する。図5(B)で例示する符号化ではX=A2であるため、Xは部分集合Aに属する。続いて、部分集合のインデックスを符号化する。図5(A)の例では部分集合Aのインデックス、すなわち、セットAという情報が符号化される。
復号では、セットAという情報を受信すると、信号Xの予測信号Yを生成する。信号Xは部分集合Aに属するものであるので、部分集合Aに属する点の中で、予測信号Yにもっとも近い点を選択することにより信号Xの復号を行う。ここでは、予測信号Yが図5(C)に例示するような場合、A2という値としてXが復号できる。誤り訂正用の情報(信号がどの部分集合に属するかを示すインデックス)を用いることで、Xの予測(予測信号Y)にある程度誤りがあっても正しい値A2を得ることができる。誤り訂正用の情報(上記パリティ又はインデックス)は、一般的に「付加的情報」と呼ばれる。
<DVC符号化のための装置の具体的な構成の説明>
以下、具体的なDVC符号化に関する装置の構成を説明する。図6は、従来のDVC符号化を用いた動画像符号化装置及び動画像復号装置を示すブロック図である。動画像符号化装置300は、イントラ符号化部301、変換部302、量子化部303、付加的情報生成部304、及びフレーム振り分け部331から構成される。動画像復号装置400は、イントラ復号部401、変換部402、量子化部403、付加的情報利用復号部404、再構成部405、逆変換部406、フレームメモリ407、動き補償部408、及び出力フレーム振り分け部431から構成される。
<<DVC符号化の動画像符号化装置の説明>>
動画像符号化装置300に入力された符号化対象フレームはフレーム振り分け部331によって、キーフレームとキーフレーム以外(以下、WZフレームと呼ぶ)に振り分けられる。キーフレームは、イントラ符号化部301においてフレーム内符号化方式により符号化される。WZフレームは、空間的冗長性を削減するためDCT変換などを行う変換部302で変換され、量子化部303で量子化された後、付加的情報生成部304で付加的情報が生成される。この付加的情報がWZフレームの符号化データである。キーフレームは、WZフレームの予測を可能にするために必要なものであり、数フレームに1枚の割合で符号化される。ここで、最初のWZフレームを符号化する前には複数枚(2枚以上)のキーフレームを符号化する。このように動画像符号化装置300では、符号化の結果としてキーフレームの符号化データとWZフレームの符号化データが生成され、外部へ出力されるか記憶部(図示せず)に蓄積される。
<<DVC符号化の動画像復号装置の説明>>
動画像復号装置400では、まずキーフレームの符号化データを受信し、その符号化データからイントラ復号部401によりキーフレームが復号される。復号されたキーフレームはフレームメモリ407に格納される。続いて、動画像復号装置400は、WZフレームの符号化データを受信する。WZフレームの符号化データを受信すると、まず、フレームメモリ407に格納されたフレームを参照フレームとして予測画像が生成される。
予測画像の生成について説明する。WZフレームを復号する時点では、フレームメモリ407には少なくとも複数枚の参照フレームが存在している(最初のWZフレームを復号する時点においてもすでに複数枚のキーフレームが復号されフレームメモリ407に格納されている)。動き補償部408では、1)参照フレーム間の動きを探索し、2)参照フレームと復号対象フレームの間隔に基づいて、動きの内挿もしくは外挿により、復号対象フレームと参照フレーム間の動きを推定し、3)推定された動きにより、参照フレームを用いて復号対象画像を予測する。以上の流れで予測画像を生成することができる。
生成された予測画像は変換部402でDCT変換などの変換がなされる。予測画像の変換係数は、一方では量子化部403に入力され、他方では再構成部405に入力される。量子化部403では、予測画像の変換係数が量子化される。付加的情報利用復号部404では、符号化装置より伝送された付加的情報WZを用いて、量子化後の変換係数の誤りが訂正される。誤り訂正された変換係数は再構成部405に入力される。
再構成部405では逆量子化を行う。再構成部405の逆量子化では、予測信号(ここでは、予測画像の変換係数)を用いることによって確率的に符号化対象画像の信号に近くなるように処理する。この処理は、DVC符号化では一般的な方法である(例えば、非特許文献2を参照)。従来の逆量子化を行う手段と区別するため、本明細書では、予測信号を用いない従来の逆量子化を行う手段を有する部位を逆量子化部と呼び、予測信号を用いた逆量子化を行う手段を有する部位を再構成部と呼ぶ。
図7は、通常の逆量子化及び予測信号を用いた逆量子化の方法を説明するための図である。ここで、図7(A),(B)は、図6の再構成部405での逆量子化、すなわち予測信号Yを用いた逆量子化の方法を説明するための図で、図7(C)は、図7(A),(B)との比較のために、予測信号Yを用いない逆量子化を説明するための図である。量子化とは、ある値の範囲(複数の値)に対して1つの値(量子化代表値)を割り当てる処理であるから、量子化代表値となる量子化前の値は複数ある(範囲をとる)。例えば、−2、−1、0、1、2に0を割り当てるような量子化の場合には、量子化により0となる量子化前の値は、この場合−2、−1、0、1、2の範囲となる。
通常の逆量子化(予測信号Yを用いない逆量子化)では、図7(C)に示すように、量子化前の値の範囲内の1つの値を量子化代表値とし、量子化された値から量子化代表値を得ることで逆量子化が行われる。前の例では、−2、−1、0、1、2のうちの1つの値として0を量子化代表値とする(0の逆量子化では0が得られる)。
それに対し、予測信号を用いた逆量子化は、量子化された値から決まる1つの量子化代表値を用いるのではなく、予測信号が量子化前の範囲にあるかどうかで値を変える。具体的には、図7(A)に示すように、予測信号が量子化前の係数の値の範囲にあれば、予測信号をそのまま用いる。逆に、図7(B)に示すように、予測信号が量子化前の係数の範囲外であれば、量子化前の係数の範囲内の値のうち予測信号に最も近い値を用いる。このような処理によって、単純に量子化代表値を用いるよりも、確率的に元の値に近い値を求めることができる。
再構成部405により逆量子化された変換係数は、逆変換部406において逆変換がなされ画像が復号される。復号画像は、出力画像として出力されると共に、フレームメモリ407に格納される。フレームメモリ407に格納された画像は、後続のフレームにおいて、復号対象ブロックの予測画像の生成に用いることができる。出力フレーム振り分け部431は、復号されたキーフレームを外部(表示装置等)へ出力するか、逆変換部406から出力された復号後のWZフレームを外部へ出力するかを振り分ける。動画像復号装置400では、この振り分けにより正しい順序でフレームが外部出力できる。勿論、外部出力の代わりに、図示しない記憶部へ出力(つまり蓄積)してもよい。
このように、符号化装置では予測信号の生成を行わずに復号装置で予測信号の生成を行うDVC符号化では、予測信号を用いた逆量子化(再構成)を行うことで復号画像の画質を向上させる処理が広く用いられている。
特開2007−274035号公報
高村誠之、「Distributed Video Codingの動向と今後」、情報処理学会研究報告2006-AVM-54
A. Aaron, R. Zhang and B. Girod, "Wyner-Ziv coding of motion video," Proc. Asilomar Conference on Signals and Systems , Pacific Grove, CA, Nov. 2002
図1は、本発明の一実施形態に係る動画像符号化装置の構成例を示すブロック図である。図1で例示する動画像符号化装置100は、イントラ符号化部101、変換部102、量子化部103、付加的情報生成部104、逆量子化部110、逆変換部111、フレームメモリ112、予測画像生成部113、減算部114、変換部115、量子化部116、可変長符号化部117、逆量子化部118、逆変換部119、加算部120、イントラ復号部121、フレーム振り分け部131、ブロック振り分け部132、及び出力振り分け部133を備える。
動画像符号化装置100に入力された符号化対象フレームは、まず、フレーム振り分け部131によって、キーフレームとキーフレーム以外(WZフレーム)に振り分けられる。フレーム振り分け部131の振り分けは、例えばデフォルトの振り分け規則、若しくはユーザにより直接又は間接的に設定した所定の振り分け規則に則って実行すればよい。本発明では、以下の説明から明らかなように、キーフレームの間隔を大きく設定しても(DVC符号化された部分も参照フレームとして利用できるため)、予測画像の予測精度の低下への影響は少ない。
キーフレームは、イントラ符号化部101においてフレーム内符号化方式により符号化される。イントラ符号化部101で符号化された符号化データは、出力される一方、他方でイントラ復号部121で復号され、フレームメモリ112に格納される。フレームメモリ112には、所定の枚数のフレームを保存することができ、格納されたフレームは、後述の予測画像生成部113で予測画像を生成する際に用いられる。キーフレームは、WZフレームの予測を可能にするために必要なものであり、数フレームに1枚の割合で挿入する。最初のWZフレームを符号化する前に複数枚(2枚以上)のキーフレームを符号化する。
WZフレームは、縦横16×16画素などのブロック単位で処理が行われる。WZフレームのブロックは、ブロック振り分け部132によって、DVCブロックもしくは予測符号化ブロック(以下、予測ブロックという)に振り分けられる。DVCブロックとして振り分けられたブロックは変換部102に入力され、予測ブロックとして振り分けられたブロックは予測画像生成部113及び減算部114に入力される。
ブロック振り分け部132の振り分け方法について以下に説明する。振り分け方法の1つは、数ブロックに1つの割合で予測ブロックとDVCブロックを振り分けることである。この際、振り分けは4ブロックに1つと機械的に決定することもできるし、空間的に格子パターンなるように振り分けることもできる。また、画面の周囲部分を予測符号化に振り分けることもできる。DVCブロックだけでの処理に比べ、予測ブロックを挿入することにより、動画像復号装置におけるDVCブロックの予測信号生成における予測精度を向上させることができる。
別の振り分け方法の1つは、フレームメモリ112に格納されている画像を読み出し、その画像と入力画像の差分を計算し、その差分の大きさが所定の値よりも大きい場合に予測ブロックに振り分け、所定の値よりも小さい場合にはDVCブロックに振り分ける方法である。この場合、復号対象フレームの動きが推定しにくい領域を予測ブロックとすることになるため符号化効率が向上する。なお、フレームメモリ112の画像を縮小したフレームと入力画像を縮小したフレームとの間で動きを算出することにより、フレーム全体の動きを算出することが、計算量の上から好適である。
また、別の振り分け方法の1つは、ブロック振り分け部132の内部に図示しない動き予測部を備えておき、上述の差分計算の際に、フレームメモリ112から読み出した画像(又は縮小した画像)をそのまま用いるのではなく、簡易な動き予測を行ってから差分を計算する方法である。単純に差分を計算するよりも、動きの予測が難しい部分を精度よく振り分けることができる。
また、別の振り分け方法の1つは、フレーム毎にDVCブロックと予測ブロックとを振り分ける方法、つまりフレーム単位で全てのブロックがDVCブロックとなるか或いは全てのブロックが予測ブロックとなるかを切り替える方法である。この方法では、切り替え処理自体の頻度も少なく、振り分け先の決定に際してのフレームメモリ112の参照などが不要であり、振り分けが容易になる。DVCブロックのみでなるフレームに対しても、「予測信号を用いない逆量子化を行う」ことを実行しておけば、DVC符号化されたブロックのみでなるフレームを、予測符号化及びその復号に際しての参照フレームとすることができる。また、振り分けに際しては、例えばDVC符号化で失われた画質を回復する(リフレッシュ処理を確実に行う)用途で予測ブロックとして振り分けるように、このフレーム毎のブロック振り分けを行うとよい。
DVCブロックは、空間的冗長性の削減する手段である変換部102でDCT変換などの変換がなされ、量子化部103で量子化された後、付加的情報生成部104で付加的情報が生成される。生成された付加的情報は、WZブロックの符号化データとして出力される。付加的情報とは、誤り訂正用の情報であり、一般の誤り訂正符号が利用できる。また、付加的情報としては、誤り訂正符号に限らず、値を複数の集合に分割した場合の集合のインデックスなど、値の範囲を制限するためのインデックスが利用できる(図5及びその説明を参照)。なお、付加的情報として誤り訂正符号を適用した場合には、付加的情報生成部104はパリティ生成部となる。
量子化部103の出力は、付加的情報生成部104に入力される一方、逆量子化部110にも出力される。量子化された変換係数は、逆量子化部110で逆量子化され、逆変換部111で逆変換される。逆変換により得られた画像は局所復号された画像であり、フレームメモリ112に格納される。
量子化とは、値を複数の区間に分け区間毎に値を振り直す処理であるので、量子化された値が得られた場合、量子化される前はある一定範囲にある。逆量子化部110は、予測信号を用いない逆量子化を行うものであり、量子化前の値の範囲内の1つの値を量子化代表値とし、その量子化代表値を得ることで行われる。逆量子化部110での逆量子化は、予測信号を用いないものであるため、この動画像符号化装置100で得られる(フレームメモリ112に格納される)局所復号画像は、後述する動画像復号装置の出力となる復号画像とは異なるものである。
予測ブロックの復号では、まず、予測画像生成部113においてフレームメモリ112に格納されたフレームの情報を用いて符号化対象ブロックの予測画像が生成される。フレームメモリ112に格納されたフレームの情報としては、イントラ復号部121から出力されたキーフレームの画像と、上述した逆変換部111から出力された局所復号画像(WZフレームのうちのDVCブロックの局所復号画像)と、後述する加算部120から出力された局所復号画像(WZフレームのうちの予測ブロックの局所復号画像)とが存在する。
予測画像を生成する1つの方法は、動き補償を用いるものであり、もう1つはイントラ予測を用いるものである。動き補償を用いたブロックは、すでに符号化されたフレームから、符号化対象ブロックから所定の移動量(動きベクトルと呼ばれる)だけずらした位置のブロックを切り出して生成する。動きベクトルが整数でない場合には、画素値を補間して予測画像の画素値を得る。イントラ予測を用いたブロックは、フレームメモリ112に格納された符号化対象ブロックの周囲のブロックの画素値を用いて予測する。
イントラ予測の方法の1つは、符号化対象ブロックの上ブロックと左ブロックの画素値の平均値を予測値とする方法である。他の方法として、上ブロックの画素値を下方向に延長して生成する方法や、左ブロックの画素値を右方向に延長して生成する方法がある。イントラ予測を行う場合には、これら複数の予測方法から1つの予測方法を選択して用いることが適当である。なお、イントラ予測の方法を示すフラグをここではイントラ予測モードと呼ぶ。
予測画像を生成するための情報(動き補償であれば動きベクトル、イントラ予測であればイントラ予測モード)は、可変長符号化部117に入力される。
生成された予測画像は減算部114に入力される。減算部114では、符号化対象ブロックと予測画像の差分が算出される。得られた差分は、変換部115でDCT変換などの変換がなされ、量子化部116で量子化される。量子化された変換係数は一方では可変長符号化部117に出力され、他方では逆量子化部118に出力される。
可変長符号化部117では、予測画像を生成するための情報及び量子化された変換係数が、ハフマン符号や算術符号などにより可変長符号化される。可変長符号化された符号は、符号化データとして出力される。
また、出力されるキーフレーム以外の符号化データは、可変長符号化部117からの符号化データだけでなく、上述したようにWZブロックの符号化データも存在するため、ブロック振り分け部132での振り分けに応じて出力振り分け部133で両者を振り分ける。なお、イントラ符号化部101から出力されるキーフレームの符号化データと、付加的情報生成部104又は可変長符号化部117から出力されるキーフレーム以外の符号化データとは、例えば多重化して出力すればよい。
逆量子化部118では、量子化部116で量子化された変換係数が逆量子化され、逆変換部119ではさらに逆変換される。これにより復号された差分ブロックは、加算部120で予測画像生成部113から出力された予測画像と加算され、予測ブロックの局所復号画像となる。この局所復号画像は、フレームメモリ112に格納され、上述したように予測画像の生成に使用される。
図2は、図1の動画像符号化装置におけるWZフレームの参照方法、すなわちWZフレームにおける予測の仕方について説明するための図である。図2において、K1、K2はキーフレーム、WZ1、WZ2、WZ3はWZフレームであり、WZフレーム中、空白領域はDVC符号化で符号化している領域、網掛け領域は予測符号化で符号化されている領域である。
WZ1ではK1を参照フレームとして符号化を行っている。この参照は、従来技術においても問題なく行える。WZ2では、WZ1フレームを参照フレームとして符号化を行う。WZ1のDVC符号化領域を参照しているが、本発明の動画像符号化装置100では、予測信号を用いない逆量子化を用いた局所復号を行うため問題なく参照できる。WZ3では、フレーム全体が予測符号化を行っている。領域毎に予測符号化とDVC符号化を選択する例を中心に説明したが、本発明では、この例や、フレーム毎にDVCブロックと予測ブロックとを振り分ける方法で触れたように、(ブロック振り分け部132での振り分けの結果)フレーム全体を予測符号化することも可能である。この場合、キーフレームとWZフレーム(WZ3)の間に、別のWZフレーム(WZ1,WZ2)が入った場合においても、フレーム全体を予測符号化することができる。
以上、図1の構成例を挙げて説明したように、本発明に係る動画像符号化装置は、動画像の画像信号をDVC符号化することが可能な装置であって、次の予測符号化手段、DVC符号化手段、及び局所復号画像生成手段を備える。
予測符号化手段は、フレームメモリ112、予測画像生成部113、減算部114、変換部115、量子化部116、可変長符号化部117、逆量子化部118、逆変換部119、及び加算部120で例示したように、符号化対象の画像信号のうち予測符号化を行う画像信号に対して、予測符号化用フレームメモリ(フレームメモリ112)に格納されたフレームを参照して予測信号を生成し、予測符号化を行う。また、予測符号化手段の一部としては、イントラ復号部121で例示したように、予測符号化時にキーフレームを利用する手段も有する。予測符号化時に参照されるフレームとしては、予測符号化後に復号した加算部120からの出力の他に、イントラ復号部121からのキーフレーム、並びに後述の局所復号画像生成手段で生成されたDVCブロックのフレームが含まれる。
DVC符号化手段は、変換部102、量子化部103、及び付加的情報生成部104で例示したように、符号化対象の画像信号のうちDVC符号化を行う画像信号に対して、その画像信号を量子化し量子化された信号から付加的情報を生成することで、DVC符号化を行う。また、DVC符号化手段の一部としては、イントラ符号化部101で例示したように、DVC符号化で必須となるキーフレームの符号化を行う手段も有する。また、ブロック振り分け部132は、符号化対象の画像信号に対して、画像を示すフレームを分割したブロック単位で、DVC符号化手段で符号化する対象の画像信号と予測符号化手段で符号化する対象の画像信号とを振り分けるブロック振り分け手段の一例である。
局所復号画像生成手段は、逆量子化部110及び逆変換部111で例示したように、この量子化された信号に対して逆量子化(予測信号を用いない逆量子化)を行って局所復号画像のフレームを生成し、予測符号化用フレームメモリ(フレームメモリ112)に格納する。従来、予測符号化とDVC符号化を併用する際にDVC符号化で符号化した部分を参照フレームとして利用できずに符号化効率が低下していたが、付加的情報を生成する対象(つまりDVC符号化の対象)である量子化された信号に対し、予測信号を用いない逆量子化を行うことによって局所復号画像を生成し、予測符号化時に利用可能にする上記局所復号画像生成手段により、DVC符号化した部分を復号時に参照フレームとして利用することができる。
以上説明したように、本発明の動画像符号化装置は、DVC符号化されるブロックにおいても(後述の動画像復号装置の復号とは異なる)局所復号を可能にし、その局所復号画像をフレームメモリに格納するようにしたことにより、DVC符号化されたブロックを参照した予測符号化が可能となり、結果としてDVC符号化されたブロックに対しても復号時に参照フレームとして利用して予測符号化復号を行うことが可能となる。すなわち、本発明の動画像符号化装置により、予測符号化とDVC符号化を併用する際に、DVC符号化で符号化した部分を復号時に参照フレームとして利用することができる。
このように本発明の動画像符号化装置では、一部のフレームを予測符号化とすることやフレームの一部の領域を予測符号化に用いる場合において、参照フレームに対する制限がなくなってWZフレームを参照フレームにできるため、符号化対象フレームと参照フレームとの時間的な距離を短く保ったままキーフレームの間隔を長くすることができ、また予測符号化の効率を高めることができる。このように、本発明の動画像符号化装置では、演算量は大きいが符号化効率が高い予測符号化と、演算量は少ないが場合によっては符号化効率が低下するDVC符号化の併用することによって、動画像符号化における演算量と符号化効率のバランスを向上させることができる。つまり、本発明の動画像符号化装置では、DVC符号化の特徴である「符号化に必要な演算量を抑える」ことを実現したまま、DVC符号化と予測符号化との併用を実現することが可能になる。
次に、図3を参照して、図1の動画像符号化装置100で符号化されたデータを復号する動画像復号装置について説明する。図3は、本発明の一実施形態に係る動画像復号装置の構成例を示すブロック図である。
図3で例示する動画像復号装置200は、イントラ復号部201、変換部202、量子化部203、付加的情報利用復号部204、再構成部205、逆変換部206、第1のフレームメモリ207、予測画像生成部208、逆量子化部210、逆変換部211、第2のフレームメモリ212、予測画像生成部213、可変長符号復号部217、逆量子化部218、逆変換部219、加算部220、出力フレーム振り分け部231、入力ブロック振り分け部(符号振り分け部)232、及び出力ブロック振り分け部233を備える。
動画像復号装置200では、まずキーフレームの符号化データをイントラ復号部201で復号することでキーフレームが復号される。なお、イントラ復号部201へ入力されるキーフレームの符号化データとキーフレーム以外の符号化データとが多重化されたデータとして入力画像を受信した場合には、入力画像から両者を分離すればよい。イントラ復号部201で復号されたキーフレームは、第1のフレームメモリ207に格納されると共に、第2のフレームメモリ212にも格納される。第1のフレームメモリ207に格納されたフレームはDVCブロックを復号する際に参照され、第2のフレームメモリ212に格納されたフレームは予測ブロックを復号する際に参照される。
続いて、動画像復号装置200は、WZフレームの符号化データを受信する。WZフレームとして符号化されたフレームは、ブロック単位で復号される。復号対象ブロックには、DVCブロックと予測ブロックがある。
復号対象ブロックの符号は、符号振り分け部232により、復号対象ブロックがDVCブロックであれば付加的情報利用復号部204に入力され、予測ブロックであれば可変長符号復号部217に入力される。符号振り分け部232における、予測ブロック/DVCブロックの振り分けのための情報は、マクロブロックヘッダなど符号化データのヘッダに動画像符号化装置100側で格納しておくか、或いは動画像復号装置200側で所定の振り分け規則を設定しておけばよい。後者の場合でも、決まった規則に柔軟性を与えるために、動画像符号化装置100側で、フレームヘッダに規則を選択するためのフラグを書き込むことが望ましい。例えば、振り分け規則がNブロックに1回、予測ブロックを選択するという規則であるときに、その「N」をフラグとしてフレームヘッダに書き込むとよい。
復号対象ブロックがDVCブロックである場合には、まず、予測画像生成部208により、フレームメモリ207に格納されたフレームを用いて予測画像(DVCブロックに対する予測画像)が生成される。最初のWZフレームを復号する時点では複数枚のキーフレームが復号されているので、フレームメモリ207には少なくとも複数枚の参照フレームが存在している。例えば、図4は、キーフレームとWZフレームの関係を示したものである。図4では、WZフレームとしてWZ1を復号する場合には、K1、K2のキーフレームが復号されている。このとき、フレームメモリ207に記録されたK1、K2の参照フレームを用いて以下のように予測画像を生成する。
まず、1)参照フレーム間の動きを探索する。ここではK1、K2間の動きベクトルをブロック単位で算出する。この例では、動きベクトルMV0で示される動きが検出されたとする。次に、2)参照フレームと復号対象フレームの間隔に基づいて、動きの内挿もしくは外挿により、復号対象フレームと参照フレーム間の動きを推定する。ここでは、K1、K2間の動きベクトルMV0の1/3をK1とWZ1間の動きベクトルMV1とし、K1、K2間の動きベクトルMV0の2/3をK2とWZ1間の動きベクトルMV2とする。最後に、3)動き補償により、推定された動きを用いて復号対象ブロックの予測画像を参照フレームから推定する。ここでは動きベクトルMV1によりK1から生成した画像Y1と、動きベクトルMV2によりK2から生成した画像Y2の平均をY1+Y2/2を予測画像とする。
生成された予測画像は、変換部202で変換される。予測画像の変換係数(この値は以後、予測信号として扱われる)は、一方では量子化部203に入力され、他方では再構成部205に入力される。量子化部203では、予測画像の変換係数が量子化される。付加的情報利用復号部204では、動画像符号化装置より伝送された付加的情報WZを用いて、誤り訂正などにより、量子化された変換係数の復号が行われる。なお、付加的情報が誤り訂正符号の場合、付加的情報利用復号部204は誤り訂正部となる。復号された変換係数は一方では再構成部205に入力され、他方では逆量子化部210に入力される。
再構成部205では、予測信号(DVCブロックの復号時に予測画像生成部208で生成し変換した予測画像)を用いた逆量子化を行う。再構成部205の逆量子化では、予測信号を用いることによって確率的に符号化対象画像の信号に近くなるように処理する。この処理は、図7を用いてすでに説明したものであり、量子化代表値よりも確率的に元の値に近い値を求めるものである。図7(A)に示すように予測信号(予測画像の変換係数)が量子化前の係数の範囲の中にあれば、予測信号を用いる。逆に、図7(B)に示すように予測信号が量子化前の係数の範囲外であれば、範囲の端の値で、予測信号に近い方の値を用いる。
再構成部205により逆量子化された変換係数は、逆変換部206において逆変換がなされ画像が復号される。復号された画像は、一方では出力画像として外部に出力され、他方では、第1のフレームメモリ207に格納される。第1のフレームメモリ207に格納されたフレームは、後続のDVCブロック(もしくは後続のフレームのDVCブロック)の復号において、復号対象ブロックの予測画像の生成に用いることができる。
逆量子化部210に入力された量子化済みの変換係数は、逆量子化部210で逆量子化され、逆変換部211で逆変換される。逆量子化部210での逆量子化は予測信号を用いないものであり、動画像符号化装置100の逆量子化部110で説明した処理と同じ処理である。逆変換により復号されたブロックは、第2のフレームメモリ212に格納される。第2のフレームメモリ212に格納されたフレームは、後続の予測ブロック(もしくは後続のフレームの予測ブロック)の復号において、復号対象ブロックの予測画像の生成に用いることができる。
このように、本発明の動画像復号装置200は、その主たる特徴として、逆量子化を行うために、予測信号(付加的情報復号により得た予測画像)を用いる逆量子化を行う再構成部205と、予測信号(付加的情報復号により得た予測画像)を用いない逆量子化を行う逆量子化部210とを設けている。予測信号を用いない逆量子化を行う逆量子化部210に対応する部位は、動画像符号化装置100で例示したように動画像符号化装置側にも備えることができることから、動画像符号化装置と動画像復号装置で同じ参照画像用の画像を得ることができる。
復号対象ブロックが予測ブロックである場合には、可変長符号復号部217により、予測画像を生成するための情報と量子化された変換係数が復号される。予測画像を生成するための情報(例えば動きベクトル)は、予測画像生成部213に入力される。予測画像生成部213は、予測画像を生成するための情報を用いて第2のフレームメモリ212に格納されたフレームを参照して予測画像を生成する。予測画像生成部213は、予測画像を生成するための情報が動きベクトルである場合には動き補償により予測画像を生成し、予測画像を生成するための情報がイントラ予測モードの場合には、イントラ予測により予測画像を生成する。生成された予測画像は加算部220に入力される。
可変長符号復号部217から入力された量子化された変換係数は、逆量子化部218により逆量子化され、逆変換部219により逆変換されることで、差分画像が得られる。得られた差分画像は、加算部220に出力される。加算部220では差分画像と予測画像の和により復号対象ブロックが復号される。復号されたブロックは、第1のフレームメモリ207及び第2のフレームメモリ212に格納されるとともに、出力画像として外部に出力される。
出力画像は、加算部220からの出力である復号された予測ブロックと、逆変換部206からの出力である復号されたDVCブロックと、イントラ復号部201からの出力である復号されたキーフレームとでなる。予測ブロックとDVCブロックとは、符号振り分け部232での振り分けに対応するように出力ブロック振り分け部233で振り分けられる。また、キーフレームと出力ブロック振り分け部233からの出力であるキーフレーム以外のフレームとは、出力フレーム振り分け部231で振り分けられ、出力される。
以上、図3の構成例を挙げて説明したように、本発明に係る動画像復号装置は、DVC符号化された画像信号を復号することが可能な装置であって、次の予測符号化復号手段、付加的情報利用復号手段(DVC符号復号手段)、及び逆量子化手段を備える。
予測符号化復号手段は、第2のフレームメモリ212、予測画像生成部213、可変長符号復号部217、逆量子化部218、逆変換部219、及び加算部220で例示したように、復号対象の画像信号のうち予測符号化された画像信号に対して、予測符号化復号用フレームメモリ(フレームメモリ212)に格納されたフレームを参照して予測信号を生成し、予測符号化復号を行う。また、予測符号化復号手段の一部としては、イントラ復号部201で例示したように、予測符号化復号時にキーフレームを利用する手段も有する。予測符号化復号時に参照されるフレームとしては、予測符号化復号後の加算部220からの出力の他に、イントラ復号部201からのキーフレーム、並びに後述の逆量子化手段で生成されたDVCブロックのフレームが含まれる。
付加的情報利用復号手段は、変換部202、量子化部203、付加的情報利用復号部204、再構成部205、逆変換部206、第1のフレームメモリ207、及び予測画像生成部208で例示したように、復号対象の画像信号のうちDVC符号化により符号化された画像信号に対して、予測信号(DVC符号化部分の予測画像)を生成した上で、付加的情報による復号である付加的情報復号(誤り訂正等)を実行し、予測信号(DVC符号化部分の予測画像)を用いた逆量子化を実行することで、局所復号画像のフレームを生成する。また、付加的情報利用復号手段の一部としては、イントラ復号部201で例示したように、付加的情報利用復号時にキーフレームを利用する手段も有する。また、符号振り分け部232は、復号対象の画像信号に対して、画像を示すフレームを分割したブロック単位で、付加的情報利用復号手段で復号する対象の画像信号と予測符号化復号手段で復号する対象の画像信号とを振り分けるブロック振り分け手段の一例である。
逆量子化手段は、逆量子化部210及び逆変換部211で例示したように、付加的情報復号により得た信号に対し、予測信号(DVC符号化部分の予測画像)を用いない逆量子化を行って、予測符号化復号用フレームメモリ(第2のフレームメモリ212)に格納する。このように、予測信号を用いた逆量子化(再構成)により復号画像を生成するだけでなく、予測信号を用いない逆量子化も行って予測符号化復号用フレームメモリに格納することにより、DVC符号化された部分も予測符号化復号時に参照フレームとすることができる。
以上説明したように、本発明の動画像復号装置は、DVC符号化されるブロックの復号のために、予測信号を用いた逆量子化を行う手段に加え予測信号を用いない逆量子化を行う手段を備えることにより、予測信号を用いない逆量子化を行う手段を備えた動画像符号化装置においてDVC符号化における逆量子化で生成される局所復号画像と同じ復号画像を得ることができる。従って、本発明の動画像復号装置では、予測符号化とDVC符号化を併用した際に、DVC符号化で符号化した部分を予測符号化復号時に参照フレームとして利用することができる。また、このような利用を可能にしたことから、動画像符号化装置の効果として説明した「キーフレームの間隔を長くすること」及び「予測符号化の効率を高めること」を実現した符号化データを、復号することができる。
以上、例示した本発明に係る動画像符号化装置/動画像復号装置は、全てハードウェアで構成してもよいが、その一部をソフトウェア(ファームウェアを含む)によって構成してもよい。このような構成を実現する一例として、マイクロコンピュータ等のコンピュータを利用する場合には、CPU、メモリ、バス、インターフェース、周辺装置などから構成されるハードウェアと、これらのハードウェア上にて実行可能なソフトウェア(符号化プログラム/復号プログラムも含む)を挙げることができる。CPUはこのソフトウェアを実行することで他のハードウェアを制御する。具体的には、ROMに格納されたソフトウェアをメモリ上に展開し、展開されたプログラムを順次実行することで、メモリ上のデータや、インターフェースを介して入力されるデータの加工、蓄積、出力などにより各部の機能が実現される。上述した各実施の形態における処理は、上記ソフトウェアとしてその処理手順をCPUに実行させるためのプログラムを組み込み、実行させることによって、実現できる。また、上記ソフトウェアは、記録媒体に格納して配布してもよいし、インターネット等のネットワーク経由や放送波に載せて配信してもよい。
また、上述した動画像符号化装置及び/又は動画像復号装置は、ビデオカメラをはじめ、モバイル端末の動画撮影機能の一部として搭載することができる。また、上述した動画像符号化装置は、放送波による放送やインターネット等のネットワーク経由による配信に際して動画像を符号化する装置に組み込むことができ、上述した動画像復号装置は、その放送や配信により取得した動画像を復号するチューナ、テレビ装置、各種レコーダ、パーソナルコンピュータ(PC)といった装置に組み込むことができる。さらに、上述した動画像符号化装置、動画像復号装置は、それぞれ、他の符号化形式で放送や配信などにより取得した動画像を復号しそれを再符号化して格納する際の装置として、格納された再符号化データを復号して再生する装置として、各種レコーダやPC等に組み込むことができる。
また、本発明の動画像符号化装置及び動画像復号装置について説明したが、本発明は、動画像の画像信号をDVC符号化することが可能な動画像符号化方法としての形態や、DVC符号化された動画像の画像信号を復号することが可能な動画像復号方法としての形態も採り得る。これらの方法は、動画像符号化装置や動画像復号装置内の各部によって実現でき、また上記ソフトウェアでも実現できる。本発明の動画像符号化方法及び動画像復号方法について簡単に説明する。
この動画像符号化方法は、動画像符号化装置の処理について説明したように、予測符号化を行う画像信号に対して、予測符号化用フレームメモリに格納されたフレームを参照して予測信号を生成し予測符号化を行う予測符号化ステップと、DVC符号化を行う画像信号に対して、その画像信号を量子化して付加的情報を生成することでDVC符号化を行うDVC符号化ステップと、量子化された信号に対して予測信号を用いない逆量子化を行って局所復号画像のフレームを生成し、予測符号化用フレームメモリに格納する逆量子化ステップと、を含む。本発明の動画像符号化方法の他の応用例については、動画像符号化装置について説明したのと同様である。
また、この動画像復号方法は、動画像復号装置の処理について説明したように、予測符号化された画像信号に対して、予測符号化復号用フレームメモリに格納されたフレームを参照して予測信号を生成し、予測符号化復号を行う予測符号化復号ステップと、DVC符号化により符号化された画像信号に対して、予測信号を生成した上で、付加的情報による復号である付加的情報復号を実行し、予測信号を用いた逆量子化を実行することで、局所復号画像のフレームを生成する付加的情報利用復号ステップと、その付加的情報復号により得た信号に対し、予測信号を用いない逆量子化を行って局所復号画像のフレームを生成し予測符号化復号用フレームメモリに格納する逆量子化ステップと、を含む。本発明の動画像復号方法の他の応用例については、動画像復号装置について説明したのと同様である。
100…動画像符号化装置、101…イントラ符号化部、102…変換部、103…量子化部、104…付加的情報生成部、110…逆量子化部、111…逆変換部、112…フレームメモリ、113…予測画像生成部、114…減算部、115…変換部、116…量子化部、117…可変長符号化部、118…逆量子化部、119…逆変換部、120…加算部、121…イントラ復号部、131…フレーム振り分け部、132…ブロック振り分け部、133…出力振り分け部、200…動画像復号装置、201…イントラ復号部、202…変換部、203…量子化部、204…付加的情報利用復号部、205…再構成部、206…逆変換部、207…第1のフレームメモリ、208…予測画像生成部、210…逆量子化部、211…逆変換部、212…第2のフレームメモリ、213…予測画像生成部、217…可変長符号復号部、218…逆量子化部、219…逆変換部、220…加算部、231…出力フレーム振り分け部、232…符号振り分け部、233…出力ブロック振り分け部、K1,K2,K3…キーフレーム、WZ1…WZフレーム、MV0,MV1,MV2…動きベクトル。