JP2007097218A - 動画像復号化方法及び装置 - Google Patents

動画像復号化方法及び装置 Download PDF

Info

Publication number
JP2007097218A
JP2007097218A JP2006327621A JP2006327621A JP2007097218A JP 2007097218 A JP2007097218 A JP 2007097218A JP 2006327621 A JP2006327621 A JP 2006327621A JP 2006327621 A JP2006327621 A JP 2006327621A JP 2007097218 A JP2007097218 A JP 2007097218A
Authority
JP
Japan
Prior art keywords
prediction
image
image signal
signal
predicted image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006327621A
Other languages
English (en)
Other versions
JP4227167B2 (ja
Inventor
Takeshi Nakajo
健 中條
Shinichiro Koto
晋一郎 古藤
Yoshihiro Kikuchi
義浩 菊池
Akiyuki Tanizawa
昭行 谷沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2006327621A priority Critical patent/JP4227167B2/ja
Publication of JP2007097218A publication Critical patent/JP2007097218A/ja
Application granted granted Critical
Publication of JP4227167B2 publication Critical patent/JP4227167B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

【課題】フェード画像やディゾルブ画像のような時間的に輝度が変化する動画像に対して高効率の符号化を可能とする。
【解決手段】参照画像番号と予測パラメータとの複数の組合せの中から一つの組み合わせを選択して予測画像信号212を生成する第1の予測モードと、複数の参照画像の参照画像番号及び画像間距離に基づいて算出される予測パラメータに従って予測画像信号を生成する第2の予測モードを持つフレームメモリ/予測画像生成器108を備え、参照画像数によっていずれかの予測モードを選択し、入力動画像信号100に対する予測画像信号212の予測誤差信号に関わる直交変換係数情報210、符号化モードを示すモード情報213、動きベクトル情報214及び選択された参照画像番号と予測パラメータとの組み合わせを示すインデックス情報215を可変長符号化器111によって符号化する。
【選択図】 図1

Description

この発明は、特にフェード画像やディゾルブ画像に対して効率の高い符号化/復号化を行う動画像符号化/復号化方法及び装置に関する。
ITU−T H.261,H.263,ISO/IEC MPEG−2,MPEG−4といった動画像符号化標準方式では、符号化モードの一つとして動き補償予測フレーム間符号化が用いられる。動き補償予測フレーム間符号化における予測モデルとしては、時間方向には明るさが変化しない場合に最も予測効率が高くなるようなモデルが採用されている。画像の明るさが変化するフェード画像の場合、例えば黒い画像からフェードインして通常の画像になるような場合などにおいて、画像の明るさの変化に対して適切に予測を行う方法は知られていない。従って、フェード画像においても画質を維持するためには、多くの符号量を必要とするという問題がある。
この問題に対し、例えば特許第3166716号「フェード画像対応動画像符号化装置及び符号化方法」(特許文献1)では、フェード画像部分を検出して符号量の割り当てを変更することで対応している。具体的には、フェードアウト画像の場合、輝度が変化するフェードアウトの始まり部分に多くの符号量を割り当てる。フェードアウトの最後の部分は、通常、単色の画像になることから容易に符号化が可能となるため、符号量の割り当てを減らす。このようにすることで、総符号量を余り増大させることなく全体の画質を向上させている。
一方、特許第2938412号「動画像の輝度変化補償方法、動画像符号化装置、動画像復号装置、動画像符号化もしくは復号プログラムを記録した記録媒体及び動画像の符号化データを記録した記録媒体」(特許文献2)では、輝度変化量とコントラスト変化量の2つのパラメータに従って参照画像を補償することで、フェード画像に対応する符号化方式を提案している。
Thomas Wiegand and Berand Girod, “Multi-frame motion-compensated prediction for video transmission”, Kluwer Academic Publishers 2001 (非特許文献1)には、複数のフレームバッファに基づく符号化方式が提案されている。この方式では、フレームバッファに保持されている複数の参照フレームから選択的に予測画像を作成することで、予測効率の向上を図っている。
特許第3166716号 特許第2938412号 Thomas Wiegand and Berand Girod, "Multi-frame motion-compensated prediction for video transmission", Kluwer Academic Publishers 2001
特許文献1では、フェード画像部分を検出して符号量の割り当てを変更することでフェード画像の符号化において総符号量を増大させることなく画質を向上させるために、既存の符号化方式の枠組みの中で実現できる利点はあるが、本質的に予測効率を上げているわけではないので、大きな符号化効率の向上は期待できない。
一方、特許文献2では、フェード画像に対する予測効率が向上するというメリットがあるが、画像がある画像から別の画像に徐々に変化する、いわゆるディゾルブ画像(クロスフェード画像とも呼ばれる)に対しては、十分な予測効率が得られない。
非特許文献3の方式では、フェード画像やディゾルブ画像に対しては十分な対応がなされておらず、複数の参照フレームを用意しても予測効率の改善を図ることはできない。
上述したように従来の技術によると、フェード画像やディゾルブ画像を高い画質を維持しつつ符号化するには多くの符号量を必要とし、符号化効率の向上が期待できないという問題点があった。
そこで、本発明は特にフェード画像やディゾルブ画像のような時間的に輝度が変化する動画像に対して、高効率の符号化を可能とし、かつ計算量の少ない動画像符号化及び動画像復号化の方法及び装置を提供することを目的とする。
上記の課題を解決するため、本発明の第1の態様では動画像の符号化側において、入力動画像信号に対して少なくとも一つの参照画像信号、及び該入力動画像信号と該参照画像信号との間の動きベクトルを用いて動き補償予測符号化を行う際、動き補償予測符号化に用いる参照画像の数が一つの場合には、予め用意された少なくとも一つの参照画像番号と予測パラメータとの複数の組合せの中から、入力動画像信号の符号化対象領域毎に選択された一つの組み合わせの参照画像番号及び予測パラメータに従って予測画像信号を生成する、第1の予測画像信号生成手法を用いる。
一方、動き補償予測符号化に用いる参照画像の数が複数の場合には、符号化対象領域毎に該複数の参照画像の参照画像番号、及び該複数の参照画像の画像間距離に基づいて算出される予測パラメータに従って予測画像信号を生成する、第2の予測信号生成手法を用いる。
このようにして生成された予測画像信号の入力動画像信号に対する予測画像信号の誤差を表す予測誤差信号を生成し、この予測誤差信号と動きベクトルの情報、及び選択された組み合わせと複数の参照画像の参照画像番号のいずれかを示すインデックス情報を符号化する。
本発明の他の態様では、入力動画像信号の符号化対象領域の予測タイプが動き補償予測符号化に一つの参照画像を用いる第1の予測タイプである場合に第1の予測信号生成手法を用い、符号化対象領域の予測タイプが双方向予測タイプであって、かつ動き補償予測符号化に用いる参照画像の数が複数の場合に第2の予測信号生成手法を用いる。
一方、動画像の復号化側では、動画像信号に対する予測画像信号の誤差を表す予測誤差信号、動きベクトル情報、及び一つの参照画像番号と予測パラメータとの組み合わせと複数の参照画像の参照画像番号のいずれかを示すインデックス情報を含む符号化データを復号化する。復号化されたインデックス情報が組み合わせを示す場合には、該組み合わせの参照画像番号と予測パラメータに従って予測画像信号を生成する。復号化されたインデックス情報が複数の参照画像の参照画像番号を示す場合には、該参照画像番号、及び該複数の参照画像の画像間距離に基づいて算出される予測パラメータに従って予測画像信号を生成する。このようにして生成された予測誤差信号及び予測画像信号を用いて、再生動画像信号を生成する。
このように本発明によると、参照画像番号と予測パラメータの組み合わせに従って予測画像信号を生成する第1の予測画像生成手法と、選択された複数の参照画像のフレーム間距離に基づいて算出される予測パラメータを用いて予測画像信号を生成する第2の予測画像生成手法を用意しておき、動き補償予測符号化に用いる参照画像の数や予測タイプに応じていずれかの予測画像生成手法を選択して用いる。
これによって、フェード画像やディゾルブ画像のような通常の動画像符号化の予測方式では適切な予測画像信号が作成できないような入力動画像信号に対しても、より予測効率の高い予測方式に基づいて適切な予測画像信号を作成できる。
また、画素当たりの乗算回数を1回にすることも可能であるため、符号化側及び復号化側のいずれにおいても、ハードウェア規模や演算コストを削減することができる。
さらに、符号化側から復号化側に対して参照画像番号や予測パラメータの情報そのものを送るのではなく、参照画像番号と予測パラメータの組み合わせを示すインデックス情報を送るか、あるいは参照画像番号を別途送る場合には予測パラメータの組み合わせを示すインデックス情報を送ることによって、符号化効率を改善することができる。
以上説明したように、本発明によれば特にフェード画像やディゾルブ画像のような時間的に輝度が変化する動画像に対して適切な予測をうことよって効率が高く、しかも計算量の少ない動画像符号化/復号化を行うことができる。
以下、図面を参照して本発明の実施形態について説明する。
[第1の実施形態]
(符号化側について)
図1に、本発明の第1の実施形態に係る動画像符号化装置の構成を示す。動画像符号化装置には、この例では例えばフレーム単位で動画像信号100が入力される。この動画像信号100は減算器101に入力され、ここで予測画像信号212との差分がとられて予測誤差信号が生成される。モード選択スイッチ102によって予測誤差信号と入力動画像信号100のいずれか一方が選択され、直交変換器103により直交変換、例えば離散コサイン変換(DCT)が施される。直交変換器103では直交変換係数情報、例えばDCT係数情報が得られる。直交変換係数情報は量子化器104で量子化された後、二分岐される。二分岐された量子化直交変換係数情報210の一方は、可変長符号化器215に導かれる。
二分岐された量子化直交変換係数情報210の他方は、逆量子化器105及び逆直交変換器106により量子化器104及び直交変換器103の処理と逆の処理を順次受けて予測誤差信号と同様の信号とされた後、加算器107でスイッチ109を介して入力される予測画像信号212と加算されることにより、局部復号画像信号211が生成される。局部復号画像信号211は、フレームメモリ/予測画像生成器108に入力される。
フレームメモリ/予測画像生成器108は、予め用意された参照フレーム番号と予測パラメータの複数の組み合わせの中から一つの組み合わせを選択する。選択された組み合わせの中の参照フレーム番号で示される参照フレームの画像信号(局部復号化画像信号211)について、選択された組み合わせの中の予測パラメータに従って線形和を計算し、さらに予測パラメータに従ったオフセットを加算することにより、この例ではフレーム単位の参照画像信号を生成する。この後、フレームメモリ/予測画像生成器108は参照画像信号に対して動きベクトルを用いて動き補償を行い、予測画像信号212を生成する。
この過程でフレームメモリ/予測画像生成器108は、動きベクトル情報214と、参照フレーム番号と予測パラメータの選択された組み合わせを示すインデックス情報215を生成し、さらにモード選択器212に符号化モードの選択に必要な情報を送る。動きベクトル情報214及びインデックス情報215は、可変長符号化器111に入力される。フレームメモリ/予測画像生成器108については、後に詳しく説明する。
モード選択器110は、フレームメモリ/予測画像生成器108からの予測情報Pに基づいてマクロブロック単位に符号化モードの選択、すなわちフレーム内符号化(以下、イントラ符号化という)と動き補償予測フレーム間符号化(以下、インター符号化という)のいずれかの選択を行い、スイッチ制御信号M及びSを出力する。
イントラ符号化モードでは、スイッチ制御信号M及びSによってスイッチ102,112はA側に切り替えられ、直交変換器103に入力動画像信号100が入力される。インター符号化モードでは、スイッチ制御信号M及びSによってスイッチ102,112はB側に切り替えられ、直交変換器103には減算器102からの予測誤差信号、加算器107にはフレームメモリ/予測画像生成器108からの予測画像信号212がそれぞれ入力される。モード選択器212からはモード情報213が出力され、可変長符号化器111に入力される。
可変長符号化器111では、直交変換係数情報210、モード情報213、動きベクトル情報214及びインデックス情報215が可変長符号化され、これによって生成された各可変長符号が多重化器114で多重化された後、出力バッファ115により平滑化される。こうして出力バッファ115から出力される符号化データ116は、図示しない伝送系または蓄積系へ送出される。
符号化制御器113は、減算器101から可変長符号化器111までの要素で構成される符号化部112の制御、具体的には例えば出力バッファ115のバッファ量をモニタし、バッファ量が一定となるように量子化器104の量子化ステップサイズなどの符号化パラメータの制御を行う。
(フレームメモリ/予測画像生成器108について)
図2には、図1におけるフレームメモリ/予測画像作成器108の詳細な構成を示す。図2において、図1中の加算器107から入力される局部復号画像信号211は、メモリ制御器201による制御の下でフレームメモリセット202に格納される。フレームメモリセット202は、局部復号画像信号211を参照フレームとして一時保持するための複数(N)のフレームメモリFM1〜FMNを有する。
予測パラメータ制御器203は、予め参照フレーム番号と予測パラメータの複数の組み合わせをテーブルとして用意しており、入力動画像信号100に基づいて予測画像信号212の生成に用いる参照フレームの参照フレーム番号と予測パラメータの組み合わせを選択し、選択された組み合わせを示すインデックス情報215を出力する。
複数フレーム動き評価器204では、予測パラメータ制御器203により選択された参照フレーム番号とインデックス情報の組み合わせに従って参照画像信号を作成し、この参照画像信号と入力画像信号100とから動き量と予測誤差の評価を行い、予測誤差を最小とする動きベクトル情報214を出力する。複数フレーム動き補償器205は、複数フレーム動き評価器204でブロック毎に選択された参照画像信号に対し、動きベクトルに従って動き補償を行うことによって予測画像信号212を生成する。
(予測画像の生成について)
以下の数式(1)(2)(3)は、予測パラメータ制御器203で用意されている、参照画像番号と予測パラメータを用いた予測式の例を示している。ここで示す例は、いわゆるPピクチャと呼ばれる符号化対象画像に対して、1枚の参照画像(参照ピクチャ)を用いて動き補償予測により予測画像信号を生成する場合と、いわゆるBピクチャと呼ばれる符号化対象画像に対して、2枚の参照画像のどちらか1つのみを用いて動き補償予測により予測画像信号を生成する場合に適用される予測式を示している。
Figure 2007097218
ここで、Yは輝度信号の予測画像信号、Cb,Crは二つの色差信号の予測画像信号、RY(i),RCb(i),RCr(i)はインデックスiの参照画像信号のうちの輝度信号及び二つの色差信号の画素値をそれぞれ表している。D1(i),D2(i)は、それぞれインデックスiの輝度信号の予測係数及びオフセットである。E1(i),E2(i)は、それぞれインデックスiの色差信号Cbの予測係数及びオフセットである。F1(i),F2(i)はそれぞれインデックスiの色差信号Crの予測係数及びオフセットである。インデックスiは、0から(最大参照画像枚数−1)の値をとり、符号化対象ブロック毎(例えば、マクロブロック毎)に符号化されて動画像復号化装置に伝送される。
予測パラメータD1(i),D2(i),E1(i),E2(i),F1(i),F2(i)は、予め動画像符号化装置と復号化装置間で決められた値、あるいはフレーム、フィールド及びスライスといった予め決められた符号化の単位であり、符号化データと共に符号化されて動画像符号化装置から復号化装置へ伝送されることによって、両装置で共有される。
数式(1)(2)(3)は、参照画像信号に乗算する予測係数の分母を2のべき乗、すなわち2,4,8,16,…のように選定することによって割り算を避け、算術シフトによって計算できる予測式とされている。これによって、割り算による計算コストの増大を避けることができる。
すなわち、数式(1)(2)(3)における>>は、a>>bとおいたときに、整数aを右にbビット算術シフトする演算子である。関数clip( )は、( )内の値を0よりも小さいときには0とし、255より大きいときには255にするクリッピング関数であり、0から255の整数値を返す。
ここで、LYは輝度信号のシフト量であり、LCは色差信号のシフト量である。これらのシフト量LY ,LCは、予め動画像符号化装置と復号化装置とで決められた値が用いられるか、動画像符号化装置においてフレーム、フィールドあるいはスライスといった予め決められた符号化単位でテーブル及び符号化データと共に符号化されて動画像復号化装置へ伝送されることにより、両装置で共有される。
本実施形態では、図2中の予測パラメータ制御器203において、図3で示されるような参照画像番号と予測パラメータの組み合わせテーブルが用意される。このテーブルは参照画像数が1枚の場合に用いられる。図3において、インデックスiはブロック毎に選択され得る予測画像に対応している。この例では、インデックスiの0〜3に対応して4種類の予測画像が存在する。参照画像番号は、言い換えれば参照画像として用いられる局部復号画像の番号である。図3に示すテーブルは、数式(1)(2)(3)に対応して輝度信号と二つの色差信号に割り当てられた予測パラメータD1(i),D2(i),E1(i),E2(i),F1(i),F2(i)を有する。
Flagは、インデックスiが示す参照画像番号に予測パラメータを使った予測式を適用するか否かを示すフラグである。Flagが“0”ならば、予測パラメータを用いないでインデックスiが示す参照画像番号の局部復号画像を用いて動き補償予測を行う。Flagが“1”ならば、インデックスiが示す参照画像番号の局部復号画像と予測パラメータを用いて、数式(1)(2)(3)に従って予測画像を作成して動き補償予測を行う。このFlagの情報についても、予め動画像符号化装置と復号化装置とで決められた値が用いられるか、動画像符号化装置においてフレーム、フィールドあるいはスライスといった予め決められた符号化単位でテーブル及び符号化データと共に符号化され、動画像復号化装置へ伝送されることにより、両装置で共有される。
これらの例では、参照画像番号105はインデックスiがi=0の場合は、予測パラメータを用いて予測画像を作成し、i=1の場合は予測パラメータを用いずに動き補償予測を行っている。このように、同じ参照画像番号に対して、複数の予測方式が存在してもよい。
以下の数式(4)(5)(6)は、2枚の参照画像数を用いて予測画像信号を作成する場合の予測パラメータ制御器203で用意されている参照画像番号と予測パラメータの予測式の例を示している。
Figure 2007097218
ここで、数式(5)の関係が成り立つことから、数式(4)は次のように変形できる。
Figure 2007097218
ここでは、いわゆるBピクチャの場合で双方向予測を行う場合の予測式の例を示している。このとき、インデックスはi,jの2つ存在し、R(i),R(j)がそれぞれのインデックスi,jに対応する参照画像である。従って、インデックス情報としては、iとjの2つの情報が送られるものとする。ここで、W(j,j)がインデックスiとjのときの予測係数である。予測係数Wの計算に用いられる関数Uは画像間距離を表す関数であり、U(i,j)でインデックスiの示す参照画像とインデックスjの示す参照画像間の距離を表す。nは、現在符号化しようとしている符号化対象画像の位置である。
本実施形態では、時間的に過去の画像ほど小さな値の位置情報を持つとしている。従って、もしインデックスiが示す参照画像がインデックスjの指し示す参照画像よりも時間的に未来ならばU(i,j)>0、インデックスiとインデックスjが時間的に同じ参照画像を指している場合はU(i,j)=0、インデックスiが示す参照画像がインデックスjの指し示す参照画像よりも時間的に過去ならばU(i,j)<0となる。予測係数Wの値は、U(i,j)が0のときは2L-1とする。
具体的には、現在符号化しようとしている符号化対象画像と2つの参照画像との時間的位置関係は、インデックスi,インデックスjを用いて図4〜図7で示されるように表される。図4は、符号化対象画像nがインデックスiで示される参照画像とインデックスjで示される参照画像に挟まれる関係になっている場合の例を示している。
ここで、Tn ,T ,Tはそれぞれ符号化対象画像、インデックスiの示す参照画像、インデックスjの示す参照画像の位置を表しており、ここでは右に行くほど大きな値をとるようになっている。従って、Ti<Tn<Tjの関係が成り立つ。ここで予測係数Wの計算に用いられる関数Uは、U(n,i)=Tn−Ti ,U(j,i)=Tj−Tiで求められ、U(n,i)>0,U(j,i)>0である。
図5は、インデックスiで示される参照画像とインデックスjで示される参照画像がいずれも符号化対象画像nよりも時間的に過去の位置の関係になっている場合の例を示している。ここでは、U(n,i)>0、U(j,i)≦0の関係になる。
図6は、インデックスiで示される参照画像とインデックスjで示される参照画像がいずれも符号化対象画像nよりも時間的に過去の位置の関係になっている場合の別の例を示している。ここでは、U(n,i)>0、U(j,i)≧0の関係になる。
図7は、インデックスiで示される参照画像とインデックスjで示される参照画像がいずれも符号化対象画像nよりも時間的に未来の位置の関係になっている場合の例を示している。ここでは、U(n,i)<0、U(j,i)≧0の関係になる。
数式(4)〜(8)においてLはシフト量であり、予め動画像符号化装置と復号化装置間で決められた値を用いるか、あるいはフレーム、フィールド、スライスといった予め決まった符号化の単位で、テーブル及び符号化データと共に符号化されて符号化装置から復号化装置に伝送され、両装置で共有される。さらに、数式(6)(9)におけるclip2という関数は、clip2( )の( )内の値(以下、単に値という)の最大値及び最小値を制限して、整数を返す関数である。この関数clip2に関して、以下に複数の構成例を示す。
関数clip2の第1の構成は、値が−2Mよりも小さいときに−2M、値が(2M−1)より大きいときに(2M−1)にするクリッピング関数で、−2M以上(2M−1)以下の整数値を返す。このような構成にすることで、画素が8ビットだとすると、(R(j)−R(i))の値の表現に9ビット、予測係数Wの表現に(M+1)ビット必要なので,(M+10)ビットの演算精度で予測画像値の演算が可能となる。なお、MはL以上の非負の整数とする。
関数clip2の第2の構成としては、値が−2よりも小さいときに2L-1、値が(2M−1)より大きいときに2L-1にする規則を持っていて、−2M以上(2M−1)以下の整数値を返す関数とする。このような構成にすることで、2つの参照画像の距離関係が例外的な場合は、全て平均値予測になるようにすることができる。
関数clip2の第3の構成としては、値が1よりも小さいときに1、値が2Mより大きいときに2Mにするクリッピング関数で、1以上2M以下の整数値を返す関数とする。関数clip2の第1の構成との違いは、予測係数Wの値が負にならないということであり、参照画像の位置関係がより制限される。従って、同一の参照画像2枚の組合せでも、図5と図6の関係のようにインデクスiとインデクスjの指し示し方を逆転させることによって、予測係数Wによる予測と平均値予測を切り替えることが可能となる。
関数clip2の第4の構成としては、値が0よりも小さいときに0、値が2Lより大きいときに2Lにするクリッピング関数で、0以上2L以下の整数値を返す関数とする。このような構成にすることで、予測係数Wの値が必ず2L以下の非負の値になるので、外挿予測が禁止され、その代わり双方向予測においても2つの参照画像のいずれかが予測に使われることになる。
関数clip2の第5の構成としては、値が1よりも小さいときに2L-1、値が2Lより大きいときに2L-1にするクリッピング関数で、1以上2L−1以下の整数値を返す関数とする。このような構成にすることで、予測係数Wの値が必ず2L−1以下の非負の値になるので、外挿予測が禁止され、その代わり2つ参照画像の平均値予測に使われることになる。
なお、2つの参照画像間の距離が不明あるいは未定義の場合、例えば、参照画像のどちら一方、あるいは両方が背景用や長期保存用の参照画像であった場合、予測係数Wは、2L-1の値をとるものとする。予測係数Wは、フレーム、フィールド、スライスなどの符号化の単位で予め計算しておくことが可能なため、画素当たりの計算において、2つの参照画像数で予測画像信号を作成する場合でも、1回の乗算ですむ。
Figure 2007097218
数式(9)は、数式(4)を変形した別の例である。数式(7)においては、R(i)を予め左にLビット算術シフトする操作が必要であったが、数式(10)では括弧の外側に出すことにより算術シフトを省略している。その分、演算量を削減できる効果がある。その代わり、R(i)とR(j)の値の大小関係によって、シフトをしたときの丸めの方向が異なるため、数式(4)とは厳密には同じ結果にならない。
また、数式(4)〜(8)に代えて以下の数式(10)〜(20)を用いてもよい。これは、参照画像が1つの場合の予測画像の作成方法と同様の方法で、インデックスiの参照画像1枚の予測画像と、インデックスjの参照画像1枚の予測画像を作成しておいてその平均を取ることによって、最終的な予測画像を作成する方法である。途中まで、参照画像数が1枚のときの処理ルーチンと同じものを使うことができるため、ハードウェア量やコード量の削減が可能であるという利点がある。
Figure 2007097218
(予測方式の選択と符号化モード判定の手順について)
次に、図8を用いて本実施形態におけるマクロブロック毎の予測方式(参照画像番号と予測パラメータの組み合わせ)の選択と符号化モード判定の具体的な手順の一例について説明する。
まず、変数min_Dに想定可能な最大値を入れておく(ステップS101)。LOOP1(ステップS102)は、インター符号化における予測方式の選択のための繰り返しを示し、変数iは図3に示したインデックスの値を表している。ここでは、予測方式毎の最適な動きベクトルが求めることができるように、動きベクトル情報214に関わる符号量(動きベクトル情報214に対応して可変長符号化器111から出力される可変長符号の符号量)と予測誤差絶対値和から各インデックス(参照フレーム番号と予測パラメータの組み合わせ)の評価値Dを計算し、評価値Dを最小とする動きベクトルを選択する(ステップS103)。この評価値Dをmin_Dと比較し(ステップS104)、min_Dよりも評価値Dが小さければ評価値Dをmin_Dとし、インデックスiをmin_iに代入しておく(ステップS105)。
次に、イントラ符号化の場合の評価値Dを計算し(ステップS106)、この評価値Dをmin_Dと比較する(ステップS107)。この比較の結果、min_Dの方が小さければモードMODEはインター符号化と判定し、インデックス情報INDEXにmin_iを代入する(ステップS108)。評価値Dの方が小さければ、モードMODEはイントラ符号化と判定する(ステップS109)。ここで、評価値Dは同一量子化ステップサイズでの符号量の推定量とする。
(復号化側について)
次に、図1に示した動画像符号化装置に対応する動画像復号化装置について説明する。図9に、本実施形態に係る動画像復号化装置の構成を示す。図1に示した構成の動画像符号化装置から送出され、伝送系または蓄積系を経て送られてきた符号化データ300は、入力バッファ301に一度蓄えられ、多重化分離器302により1フレーム毎にシンタクスに基づいて分離された後、可変長復号化器303に入力される。可変長復号化器303では、符号化データ300の各シンタクスの可変長符号の復号が行われ、量子化直交変換係数、モード情報413、動きベクトル情報414及びインデックス情報415が再生される。
再生された各情報のうち、量子化直交変換係数は逆量子化器304で逆量子化され、逆直交変換器305で逆直交変換される。ここでモード情報413がイントラ符号化モードを示している場合には、逆直交変換器305から再生画像信号が出力され、加算器306を介して最終的な再生画像信号310として出力される。モード情報413がインター符号化モードを示している場合には、逆直交変換器305から予測誤差信号が出力され、さらにモード選択スイッチ308がオンとされる。予測誤差信号とフレームメモリ/予測画像生成器308から出力される予測画像信号412が加算器306で加算されることにより、再生画像信号310が出力される。再生画像信号310は、フレームメモリ/予測画像作成器308に参照画像信号として蓄積される。
モード情報413、動きベクトル情報414及びインデックス情報415は、フレームメモリ/予測画像作成器308に入力される。モード情報413はモード選択スイッチ309にも入力され、該スイッチ309をイントラ符号化モードの場合にはオフ、インター符号化モードの場合にはオンとする。
フレームメモリ/予測画像生成器308は、図1に示した符号化側のフレームメモリ/予測画像生成器108と同様に、予め用意された参照画像番号と予測パラメータの複数の組み合わせをテーブルとして用意しており、この中からインデックス情報415で示される一つの組み合わせを選択する。選択された組み合わせの中の参照画像番号で示される参照画像の画像信号(再生画像信号210)について、選択された組み合わせの中の予測パラメータに従って線形和を計算し、さらに予測パラメータに従ったオフセットを加算することにより、参照画像信号を生成する。この後、生成された参照画像信号に対して動きベクトル情報414で示される動きベクトルを用いて動き補償を行うことにより、予測画像信号412を生成する。
(フレームメモリ/予測画像生成器308について)
図10に、図9におけるフレームメモリ/予測画像作成器308の詳細な構成を示す。図10において、図9中の加算器306から出力される再生画像信号310は、メモリ制御器401による制御の下でフレームメモリセット402に格納される。フレームメモリセット402は、再生画像信号310を参照画像として一時保持するための複数(N)のフレームメモリFM1〜FMNを有する。
予測パラメータ制御器403は、予め参照画像番号と予測パラメータの組み合わせを図3に示したと同様のテーブルとして用意しており、図9中の可変長復号化器303からのインデックス情報415に基づいて予測画像信号412の生成に用いる参照画像の参照画像番号と予測パラメータの組み合わせを選択する。複数フレーム動き補償器404は、予測パラメータ制御器403により選択された参照画像番号とインデックス情報の組み合わせに従って参照画像信号を作成し、この参照画像信号に対して図9中の可変長復号化器303からの動きベクトル情報414で示される動きベクトルに従ってブロック単位で動き補償を行うことによって、予測画像信号412を生成する。
(インデックス情報のシンタクスについて)
図11に、各ブロックにおいてインデックス情報を符号化する場合のシンタクスの例を示す。まず、各ブロックに対してモード情報MODEが存在する。モード情報MODEに応じて、インデックスiの値を示すインデックス情報IDiとインデックスjの値を示すインデックス情報IDjを符号化するか否かが決定される。符号化されたインデックス情報の後に、各ブロックの動きベクトル情報として、インデックスiの動き補償予測のための動きベクトル情報MViと、インデックスjの動き補償予測のための動きベクトル情報MVjが符号化される。
(符号化ビットストリームのデータ構造について)
図12は、1枚の参照画像を用いて予測画像を作成する場合のブロック毎の具体的な符号化ビットストリームの例を示している。モード情報MODEに続いてインデックス情報IDiが配置され、その後に動きベクトル情報MViが配置される。動きベクトル情報MViは、通常、2次元のベクトル情報であるが、モード情報によって示された、ブロック内部の動き補償方法によっては、更に複数の2次元ベクトルが送られる場合もある。
図13には、2枚の参照画像を用いて予測画像を作成する場合のブロック毎の具体的な符号化ビットストリームの例を示す。モード情報MODEに続いてインデックス情報IDi、インデックス情報IDjが配置され、その後に動きベクトル情報MVi、動きベクトル情報MVjが配置される。動きベクトル情報MVi及び動きベクトル情報jは、通常、2次元のベクトル情報であるが、モード情報によって示された、ブロック内部の動き補償方法によっては、更に複数の2次元ベクトルが送られる場合もある。
(まとめ)
以上説明したように本実施形態によると、1つの参照画像を用いて予測画像を作成する場合には、予測パラメータとして予測係数とオフセットを用いた線形予測を行うことにより、予測画像を作成する。この手法によって、単一色の画面との混合した映像であるフィード画像に対して、適切な予測画像を作成することができる。単純に参照ピクチャ番号と予測パラメータの複数の組み合わせの中から符号化対象ブロック毎に一つの組み合わせを選択する手法では、参照ピクチャ数が複数の場合、画素当たりの乗算数も複数回を必要とすることから計算量が多くなるが、本実施形態では必要な乗算回数は画素当たり1回で済む。
一方、2つの参照画像を用いて予測画像を作成する場合には、2つの参照画像間の距離から求めることのできる重み係数を用いて、2つの参照画像の重み付き平均を行うことにより、予測画像を作成する。この手法によって、2つの映像が混合されたディゾルブ画像に対して、適切な予測画像を作成することができる。このとき、本実施形態で用いた数式を用いれば、必要な乗算回数は画素当たり1回で済む。
このように本実施形態によれば、フィード映像に対してもディゾルブ映像に対しても、画素当たり1回の乗算で適切な予測画像を作成できる。画素当たりの乗算が1回で済むことにより、符号化側及び復号化側のいずれにおいてもハードウェア規模や演算コストを削減することが可能となる。
上述の説明では、参照画像の数によって予測画像の作成方法を切り替えたが、いわゆるピクチャタイプあるいはスライスタイプと呼ばれる予測タイプの違いによって、ピクチャ単位あるいはスライス単位で予測画像の作成方法を切り替えてもよい。例えば、Bピクチャの場合でどちらか1つの参照画像しか使わない場合には、予測パラメータを用いた予測画像の作成は行わず、通常の局部復号画像を用いた動き補償予測が行われる。
このように参照画像の数に加えて、予測タイプの違いによっても予測画像の作成方法を切り替える手法を用いた予測画像の作成手順を図14を用いて具体的に説明する。この例では、スライス単位で予測画像の作成方法を切り替えている。
まず、符号化対象領域である符号化対象スライスの予測タイプ(スライスタイプという)を判定し、符号化対象スライスをフレーム内符号化を行うI(フレーム内予測)スライスと、1つの参照画像を用いて予測を行うP(片方向予測)スライスと、最大2つの参照画像を用いて予測を行うB(双方向予測)スライスの3つに分岐する(ステップS201)。
ステップS201の判定の結果、符号化対象スライスがIスライスの場合はフレーム内符号化(イントラ符号化)を行う(ステップS202)。符号化対象スライスがPスライスの場合は、前述した1つの参照画像と予測パラメータの組み合わせによる予測方式を採用する(ステップS203)。
符号化対象スライスがBスライスの場合は、参照画像の数を調べ(ステップS204)、それに応じて予測方式を切り替える。すなわち、符号化対象スライスがBスライスであって、参照画像が1つの場合は、通常の動き補償予測を採用する(ステップS205)。符号化対象スライスがBスライスであって、参照画像が2つの場合は、前述した選択された2つの参照画像の画像間距離に応じた予測方式を採用する(ステップS206)。
[第2の実施形態]
次に、本発明の第2の実施形態について説明する。本実施形態における動画像符号化装置及び動画像復号化装置の全体的な構成は、第1の実施形態とほぼ同様であるため、第1の実施形態との相違点のみを説明する。本実施形態では、第1の実施形態と他の方式を組み合わせた場合の例を示す。
以下の数式(21)は、参照画像を2つ使用するいわゆるBピクチャの双方向予測の場合の予測画像の予測式であり、2つの参照画像の動き補償予測画像を単純に平均する第1の手法である。
Figure 2007097218
この第1の手法では、数式(4)〜(6)、数式(7)〜(8)、数式(9)または数式(10)〜(20)のいずれかに示した予測式と、数式(21)に示した予測式と切り替え情報をピクチャ、フレーム、フィールド及びスライスといった予め決まった符号化の単位で、符号化データと共に切り替えのフラグを符号化して動画像符号化装置から復号化装置に伝送し、両装置で共有できるようにする。すなわち、必要に応じて数式(4)〜(6)、数式(7)〜(8)、数式(10)または数式(10)〜(20)のいずれかに示した予測式と、数式(21)に示した予測式とを切り替えることにする。
この第1の手法によると、画像間距離に応じた重み付平均と2つの参照画像の単純平均を適応的に切り替えることができ、予測効率の向上が期待できる。なお、数式(21)は乗算を含まないため、計算量は増加しない。
次数式(22)〜(27)と数式(28)〜(33)は、参照画像が1つのときの予測パラメータを用いて参照画像が2つの場合の予測パラメータを作成する手法を示している。本実施形態では、第1の実施形態とこれらの手法の組み合わせた例を示す。まず、数式(22)〜(27)は、参照画像が1つのときの予測式の値をそれぞれ平均して予測値を求める第2の手法である。
Figure 2007097218
ここで、PY(i),PCb(i),PCr(i)は、それぞれ輝度信号Y,色差信号Cb、色差信号Crの予測値の途中結果である。
この第2の手法では、数式(4)〜(6)、数式(7)〜(8)、数式(9)または数式(10)〜(20)のいずれかに示した予測式と、数式(22)〜(27)に示した予測式との切り替え情報をピクチャ、フレーム、フィールド及びスライスといった予め決まった符号化の単位で、符号化データと共に切り替えのフラグを符号化して動画像符号化装置から復号化装置に伝送し、両装置で共有できるようにする。このように必要に応じて数式(4)〜(6)、数式(7)〜(8)、数式(9)または数式(10)〜(20)のいずれかに示した予測式と、数式(22)〜(27)に示した予測式とを切り替えるようにする。
この第2の手法によって、画像間距離に応じた重み付平均と2つの参照画像を用いた線形予測による予測画像を適応的に切り替えることができ、予測効率の向上が期待できる。ただし、数式(22)〜(27)に示した予測式によれば、画素当たりの乗算数は2回になるが、予測係数の自由度が上がるメリットがあり、それ以上の予測効率の向上が期待できる。
次数式(28)〜(33)には、別の予測式として、参照画像が1つの場合の予測パラメータを2つ用いて作成した、参照画像が2つの場合の線形予測式の例を示す。
Figure 2007097218
この第3の手法では、数式(4)〜(6)、数式(7)〜(8)、数式(9)または数式(10)〜(20)のいずれかに示した予測式と、数式(28)〜(33)に示した予測式との切り替え情報をピクチャ、フレーム、フィールド及びスライスといった予め決まった符号化の単位で、符号化データと共に切り替えのフラグを符号化して、動画像符号化装置から復号化装置に伝送して両装置で共有できるようにする、必要に応じて数式(4)〜(6)、数式(7)〜(8)、数式(9)または数式(10)〜(20)のいずれかに示した予測式と、数式(28)〜(33)に示した予測式とを切り替えることにする。
この第3の手法によると、画像間距離に応じた重み付平均と2つの参照画像を用いた線形予測による予測画像を適応的に切り替えることができ、予測効率の向上が期待できる。ただし、数式(28)〜(33)の予測式によれば、画素当たりの乗算数は2回になるが、予測係数の自由度が上がるメリットがあり、それ以上の予測効率の向上が期待できる。
なお、上述の実施形態においてはブロック単位の直交変換を使った動画像符号化/復号化方式の例で説明したが、例えばウェーブレット変換のような他の変換手法を用いた場合にも、上記実施形態で説明した本発明の手法を同様に適用することができる。
本発明に係る動画像符号化及び復号化の処理は、ハードウェア(装置)として実現してもよいし、コンピュータを用いてソフトウェアにより実行してもよい。一部の処理をハードウェアで実現し、他の処理をソフトウェアにより行ってもよい。従って、本発明によると上述した動画像符号化または復号化処理をコンピュータに行わせるためのプログラムあるいは該プログラムを格納した記憶媒体を提供することが可能である。
本発明の第1の実施形態に係る動画像符号化装置の構成を示すブロック図 図2におけるフレームメモリ/予測画像作成器の詳細な構成を示すブロック図 同実施形態で用いる参照画像番号と予測パラメータの組み合わせテーブルの例を示す図 同実施形態における2つの参照画像と符号化対象画像間の第1の位置関係を示す図 同実施形態における2つの参照画像と符号化対象画像間の第2の位置関係を示す図 同実施形態における2つの参照画像と符号化対象画像間の第3の位置関係を示す図 同実施形態における2つの参照画像と符号化対象画像間の第4の位置関係を示す図 同実施形態におけるマクロブロック毎の予測方式(参照画像番号と予測パラメータの組み合わせ)の選択及び符号化モード判定の手順の一例を示すフローチャート 同実施形態に係る動画像復号化装置の構成を示すブロック図 図9におけるフレームメモリ/予測画像生成器の詳細な構成を示すブロック図 インデックス情報を符号化する場合のブロック毎のシンタクスの例を示す図 1枚の参照画像を用いて予測画像を作成する場合の具体的な符号化ビットストリームの例を示す図 2枚の参照画像を用いて予測画像を作成する場合の具体的な符号化ビットストリームの例を示す図 本発明の実施形態に係る符号化対象領域の種類によって予測方式を切り替える手順を示すフローチャート
符号の説明
100…入力動画像信号
101…減算器
102,109…モード選択スイッチ
103…直交変換器
104…量子化器
105…逆量子化器
106…逆直交変換器
107…加算器
108…フレームメモリ/予測画像作成器
110…モード選択器
111…可変長符号化器
112…符号化部
113…符号化制御器
114…多重化器
115…出力バッファ
116…符号化データ
201…メモリ制御器
202…複数フレームメモリ
203…予測パラメータ制御器
204…複数フレーム動き評価器
205…複数フレーム動き補償器
211…局部復号画像信号
212…予測画像信号
213…モード情報
214…動きベクトル情報
215…インデックス情報
300…符号化データ
301…入力バッファ
302…多重化分離器
303…可変長復号化器
304…逆量子化器
305…逆直交変換器
306…加算器
307…フレームメモリ/予測画像作成器
308…加算器
309…モード切替スイッチ
310…再生画像信号
401…メモリ制御器
402…複数フレームメモリ
403…予測パラメータ制御器
404…複数フレーム動き補償器
412…予測画像信号
413…モード情報
414…動きベクトル情報
415…インデックス情報

Claims (4)

  1. 動画像信号に対する予測画像信号の誤差及び動きベクトル情報を含む符号化データを復号するステップと、
    複数の参照画像が動き補償予測符号化に使用されるとき、復号化対象ブロック毎に複数の参照画像間の画像間距離に基づいて算出される重み係数に従って、前記参照画像信号について線形和を計算して第1の予測画像信号を生成する第1のステップと、
    前記画像間距離が0のとき、又は前記画像間距離が不明又は未定義のとき前記複数の画像の画素値の平均値に従って第2の予測画像信号を生成する第2のステップと、
    前記第1及び第2の予測画像信号を用いて再生動画像を生成する第3のステップと、
    を含み、前記動画像信号は輝度信号と二つの色差信号を有し、前記重み係数は該輝度信号及び二つの色差信号毎に算出されることを特徴とする、動画像復号化方法。
  2. 前記重み係数は分母が2のべき乗であることを特徴とする、請求項1記載の方法。
  3. 動画像信号に対する予測画像信号の誤差及び動きベクトル情報を含む符号化データを復号する復号化手段と、
    複数の参照画像が動き補償予測符号化に使用されるとき、復号化対象ブロック毎に複数の参照画像間の画像間距離に基づいて算出される重み係数に従って、前記参照画像信号について線形和を計算して第1の予測画像信号を生成する第1の予測画像信号生成手段と、
    前記画像間距離が0のとき、又は前記画像間距離が不明又は未定義のとき前記複数の画像の画素値の平均値に従って第2の予測画像信号を生成する第2の予測画像信号生成手段と、
    前記第1及び第2の予測画像信号を用いて再生動画像を生成する再生動信号生成手段と、
    を具備し、前記動画像信号は輝度信号と二つの色差信号を有し、前記重み係数は該輝度信号及び二つの色差信号毎に算出されることを特徴とする、動画像復号化装置。
  4. 前記重み係数は分母が2のべき乗であることを特徴とする、請求項3記載の装置。
JP2006327621A 2006-12-04 2006-12-04 動画像復号化方法及び装置 Expired - Lifetime JP4227167B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006327621A JP4227167B2 (ja) 2006-12-04 2006-12-04 動画像復号化方法及び装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006327621A JP4227167B2 (ja) 2006-12-04 2006-12-04 動画像復号化方法及び装置

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2002339931A Division JP2004179687A (ja) 2002-11-22 2002-11-22 動画像符号化/復号化方法及び装置

Publications (2)

Publication Number Publication Date
JP2007097218A true JP2007097218A (ja) 2007-04-12
JP4227167B2 JP4227167B2 (ja) 2009-02-18

Family

ID=37982235

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006327621A Expired - Lifetime JP4227167B2 (ja) 2006-12-04 2006-12-04 動画像復号化方法及び装置

Country Status (1)

Country Link
JP (1) JP4227167B2 (ja)

Also Published As

Publication number Publication date
JP4227167B2 (ja) 2009-02-18

Similar Documents

Publication Publication Date Title
JP4256456B2 (ja) 動画像復号化方法及び装置
JP2004179687A (ja) 動画像符号化/復号化方法及び装置
JP4227168B2 (ja) 動画像符号化方法及び装置
JP4227162B2 (ja) 動画像符号化方法及び装置
JP4227166B2 (ja) 動画像符号化方法及び装置
JP4227164B2 (ja) 動画像符号化方法及び装置
JP4227163B2 (ja) 動画像復号化方法及び装置
JP4227165B2 (ja) 動画像復号化方法及び装置
JP4227167B2 (ja) 動画像復号化方法及び装置
JP4227188B2 (ja) 動画像復号化方法及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080527

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080723

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081125

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081127

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4227167

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111205

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121205

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131205

Year of fee payment: 5

EXPY Cancellation because of completion of term