JP2001320715A

JP2001320715A - 動画の局所的階層符号化方法

Info

Publication number: JP2001320715A
Application number: JP2001140361A
Authority: JP
Inventors: Mathias Wien; ヴィーンマティアス
Original assignee: Robert Bosch GmbH
Current assignee: Robert Bosch GmbH
Priority date: 2000-05-10
Filing date: 2001-05-10
Publication date: 2001-11-16
Also published as: GB2363274A; GB0111024D0; DE10022520A1; GB2363274B

Abstract

(57)【要約】【課題】動画のハイブリッドな局所的階層符号化方法
の符号化効率をさらに高めること。【解決手段】動き予測を、局所的高分解能段ＥＬに対
して目下の画像信号と参照画像信号の補間されたバージ
ョンに基づいて実施し、この場合参照画像信号として、
時間的に事前に求められたか伝送された画像信号を用い
る。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、種々異なる局所的
な解像度ないし分解能の少なくとも２つの段における、
局所的階層化可能な動画符号化方法に関する。

【０００２】

【従来の技術】階層化可能な画像符号化方法は、様々な
解像度ないし分解能で符号化された信号の復号化を可能
にする。通常は、階層化段の間で解像度（ないし分解
能）が倍加される。高い方の解像度の復号化に対して
は、低い方の解像度の全てが必要とされる（階層構
造）。これらの段は、別個のビットストリームで符号化
される。

【０００３】これまでに標準化されてきた局所的階層化
の可能な方式は、ハイブリッドな符号化構造をベースに
している（例えば国際標準化機構の国際規格の最終仕様
である公知文献[1]“ISO/IEC JTC1 IS 144962-2 (MPEG-
4)；Information technology-generic coding of audio
-visual objects,0ct.1998”やITU-T の文献[2]“Video
coding for low bitrate communication（H.263. Vers
ion２）, Sep.1997”参照）。この階層化方式は、ピラ
ミッド型の構造を有しており、そこでは低い局所的解像
度ないし分解能を有する段のベースレイヤと、高い局所
的解像度ないし分解能を有する段のエンハンスレイヤに
おいて符号化が行われる。エンハンスレイヤの符号化に
対しては、エンハンスイントラプレディケーション（こ
の場合先行のフレームからの情報はなく、目下のベース
レイヤからの情報が利用される）とエンハンスインター
プレディケーション（この場合エンハンスレイヤ毎に動
きベクトルと予測誤差が伝送される）が適用されてい
る。この場合エンハンスレイヤに対して可用の、動きベ
クトルと予測誤差の間のレートが分割される。

【０００４】公知文献[3]“T.Naveen and J.W. Woods;
Motion comensated Multiresolution transmission of
high definition video, IEEE Trans. on Circuits and
Systems for Video Technology, Vol. 4, P29-41,Feb.
1994”には、動きベクトルの伝送なしで間に合ってい
る局所的階層化方式が紹介されている。

【０００５】さらに公知文献[4]“A. Nosratinia and
M.T. Orchard; Multiresolution backward video codin
g, in Proc. IEEE Int. Conf. Image Processing ICIP
′95,vol. 2, p.563-566, Oct. 1995”及び公知文献
[5]“X. Yang and K. Ramchandran, Hierarchical back
ward motion copensation for wavelet video coding o
ptimized interpolation filters, in Proc. IEEE Int.
Conf. Image ProcessingICIP ′97, vol. 1, P85-88,
Oct. 1997”には、離散ウエーブレット変換（以下では
単にＤＷＴとも称する）を用いた階層符号化方式が開示
されている。この場合は階層的動き予測が、これまでに
符号化されてきた目下のフレームと参照フレームの離散
ウエーブレット変換の分解段で実施される。これらは送
信側にも受信側にも既知であるので、この方式は、動き
ベクトルの伝送を省くことができる。

【０００６】単段式のＤＷＴは、１つのフレームを行方
向と列方向でそれぞれ低域通過成分（Ｌ）と高域通過成
分（Ｈ）に分解する。その結果として４つの部分帯域Ｌ
Ｌ，ＨＬ，ＬＨ，ＨＨが生じる。これらはそれぞれ１/
２の行ナンバと列ナンバを有する。これらの係数の総数
は、フレーム内の画素の数に相応する。多段式のＤＷＴ
では、この分解がそのつどの目下の分解段のＬＬ帯域に
適用される。以下の明細書ではこのＬＬ帯域を低域通過
帯域と称し、他の帯域ＨＬ，ＬＨ，ＨＨは高域通過帯域
と称する。

【０００７】前記公知文献[４]では、目下のフレームと
参照フレームの粗い分解段の低域通過帯域に対して予測
される変位ベクトルが、同じ分解段の高域通過帯域に対
して用いられる。前記文献[５]では目下のフレームと参
照フレームの粗い分解段の２つの低域通過帯域がオーバ
ーサンプリングされ、高精度に補間される。この予測さ
れた変位ベクトル領域は、精細な分解段の低域通過帯域
に対して用いられる。この動き補償される予測（ＢＫ
Ｐ）の単段式の分解は、目下のフレームの高域通過成分
に対する予測として用いられる。これらの２つの方式に
おいては、粗い段の高域通過帯域に対して予測が提供さ
れる。

【０００８】

【発明が解決しようとする課題】本発明の課題は、動画
のハイブリッドな局所的階層符号化方法の符号化効率を
さらに高めることである。

【０００９】

【課題を解決するための手段】前記課題は本発明によ
り、動き予測を、局所的高分解能段ＥＬに対して目下の
画像信号と参照画像信号の補間されたバージョンに基づ
いて実施し、この場合参照画像信号として、時間的に事
前に求められたか伝送された画像信号が用いられるよう
にして解決される。

【００１０】

【発明の実施の形態】この方法によって得られる利点
は、局所的高分解能ないし高解像度の段に対する変位ベ
クトルの伝送が省略できることである。局所的高分解能
の段ＥＬ（“Enhancement-Layer”）において動き補償
による予測に必要な変位ベクトルは、受信側に対するサ
ブ情報として必要となるのではなく、送信側（符号器）
と受信側（復号器）において、既に既知の情報から求め
られる。

【００１１】エンハンスレイヤの符号化の際の逆向き動
き補償の適用によっては、変位ベクトルと予測誤差の間
のレートの分割が回避される。この動き予測は、目下の
フレームと参照フレームの補間バージョンに対して実施
される。なぜならこれは送信側においても受信側におい
ても既知であるので、サブ情報としての予測される変位
ベクトルの伝送は必要なく、そのため予測誤差の符号化
に対してほぼ全てのデータレートが利用できる。

【００１２】これまでに標準化された局所的階層化手法
は、時間的な対応を変位ベクトルの伝送にのみ頼ってき
た。この先行フレームからの変位ベクトルを外挿する方
法に比べて本発明による方法は、目下のフレーム内に存
在する動きとのより良好な一致が得られるという利点を
有している。同時にこの方法は、現存する標準符号器の
みならず将来的な標準符号器内にも良好に組入れること
が可能である。なぜなら離散ウエーブレット変換をベー
スにした方法に比べて、符号器構造に実質的な変更を強
いることがないからである。

【００１３】先にも述べた離散ウエーブレット変換をベ
ースにした構想に比べて、本発明による方法では、エン
ハンスレイヤが変位ベクトルの予測に用いられる。これ
は予測に対して任意に低域ろはフィルタリングを施すこ
とが可能である。この方法は、ブロックをベースにした
適用例に適しており、特にこの場合は、先に述べたエン
ハンスイントラ予測方法とエンハンスインター予測方法
と並行して用いられてもよい。動き補償のための予測が
下位ブロックへのブロックの分割を許容する方法では、
エンコーダの最適なブロック分割がサブ情報として任意
に伝送可能である。

【００１４】離散ウエーブレット変換をベースにした方
法は、ブロックベースの符号化構想には適していない。
なぜなら予測画像内のブロック構造は、離散ウエーブレ
ット変換のもとでは符号化すべき高域通過情報が高く付
くからである。

【００１５】

【実施例】次に本発明を図面に基づき以下の明細書で詳
細に説明する。

【００１６】以下では階層化を２つの段で説明するが、
本発明による方法は、相応にそれ以上の多数の段でも適
用可能である。より高い局所的分解能を備えた段は、エ
ンハンスレイヤ（以下では単に“ＥＬ”とも記す）と称
され、より低い局所的分解能を備えた段はベースレイヤ
（以下では単に“ＢＬ”とも記す）称される。

【００１７】本発明による方法においては、既に伝送さ
れた目下のＢＬフレームが、サンプリングレートと補間
フィルタリングの引上げによってＥＬフレームのサイズ
と分解能にもたらされる。参照基準としては、先行する
ＥＬ画像フレームが用いられる。これは符号器側と復号
器側において既存のものである。また参照フレームは任
意に低域ろはしてもよい。それにより、相応に高度補間
されるＢＬフレームよりも高い周波数成分は含まれなく
なる。高度補間されたＢＬフレームと参照フレームの間
では動き予測が実施される。使用されるフレームは、送
信器側（符号器）にも受信器（復号器）側にも既知であ
るので、この動き予測は、符号器においても復号器にお
いても実施され得る。そのため予測変位ベクトルの伝送
は必要ない。変位ベクトルは、目下の符号化すべきＥＬ
フレームの動き補償予測ＢＫＰのために用いられる。こ
の動き補償予測ＢＫＰの際の参照基準として再び、先行
のＥＬフレームが用いられる。これも任意に事前に低域
ろはしてもよい。動き補償予測ＢＫＰの際に１つのブロ
ックが様々なサイズの下位ブロックに分割可能であるよ
うな符号化方法は、符号器のもとでも下位ブロックへの
ＥＬブロックの最適な分割が任意に求められてもよい
し、サブ情報として受信器側に伝送されてもよい。

【００１８】本発明の方法は、符号化すべきＥＬフレー
ムの全てのブロックに対して任意に用いることができる
し、あるいは既に符号化方式において存在する動き補償
予測ＢＫＰモードに対して代替的に用いられてもよい。

【００１９】以下では本発明による方法を、画像シーケ
ンスの輝度成分の例で説明する。この場合の符号化は、
１６×１６画素のいわゆるマクロブロック（ＭＢ）に基
づいたブロック方式で行われるものとする。

【００２０】本発明によるこの方法は、エンハンス後向
き予測“ＥＢＰ（enhanced backward prediction)”と
も称する。これまでに用いてきたインター予測は、“Ｅ
ＦＰ(enhanced forward prediction)”と称し、またイ
ントラ予測は“ＥＩＰ”と称する。エンハンスレイヤ
は、水平方向と垂直方向において係数２だけベースレイ
ヤよりも大きい。このサイズ比は、通常において用いら
れるものであって、その他のサイズ比ももちろん実現可
能である。

【００２１】

【外１】

【００２２】

【外２】

【００２３】本明細書では参照フレームは、符号Ｆ_ｎ _-
_１で表わす。これは時間的に先行するフレームを示唆す
るものである。さらに別の時間的間隔の中のフレームや
先行するフレームの選択も予測に対する参照基準として
用いることができる。

【００２４】

【外３】

【００２５】図１には、ベースレイヤ符号化とエンハン
スレイヤ符号化を示すブロック回路図が示されている。
ベースレイヤの符号化は公知のハイブリッド符号化構
想、例えば基本的に確率された規格に用いられているも
のに相応する。ここでは用いられている符号について短
い説明を行う。目下のベースレイヤフレームＦ_Ｂｎに対

【００２６】

【外４】

【００２７】

【外５】

【００２８】

【外６】

【００２９】ベース方式まず図１ではスイッチＳ１〜Ｓ４が次のような位置、す
なわちＳ１＝open、Ｓ２＝ｂ，Ｓ３＝ａ、Ｓ４＝ａの状態である。スイッチＳ５とＳ３は、結合されている
のでここでは変位ベクトルは伝送されない。これらのス
イッチ状態は固定であり得る。Ｖ_Ｅｎの予測は、オーバ
ーサンプリングと補間フィルタＧ（ｚ）を用いたフィル
タリングによって

【００３０】

【外７】

【００３１】動き予測ＭＥは、目下のブロックに対する
動きを予測する。このことは密な変位ベクトルフィール
ドの形態かブロックベースで実施されてもよい。変位ベ
クトルは、補償された領域の各画素毎に唯一のベクトル
が存在する場合に密と称する。ブロックベース方式では
１つのブロック、例えば８×８の画素に対して共通の１
つのベクトルが割当てられる。この場合ベクトルの伝送
はなく、ブロックベースのケースではブロック分割に関
する情報も伝送されない。

【００３２】参照フレームのフィルタリング

【００３３】

【外８】

【００３４】単純化されたベクトル探索これに対してはスイッチＳ１が閉じられる。それにより
Ｖ′_ＢｎがエンハンスレイヤＥＬの動き予測ブロックＭ
Ｅに供給され、ベクトル予測の初期化のために用いられ
る。この予測ベクトルフィールドＶ′_Ｂｎは、Ｖ_Ｂｎの
係数２だけの階層かによって生じ、それに伴ってエンハ
ンスレイヤのサイズが整合化される。この探索は、探索
コストの最小化のために、縮小された探索領域内で階層
化されたベースレイヤベクトル周辺で実行される（例え
ば２ピクセル）。このことは図２に示されている。階層
化された動きベクトルＶ′_Ｂｎ（i,j）の周りで、探索
が縮小さ

【００３５】

【外９】

【００３６】ブロック分割の伝送

【００３７】

【外１０】

【００３８】予測モードの選択この作動モードは、本発明による方法では既知の予測モ
ードに並行して用いられる。それに対しては符号化コス
トがＥＩＰ（S1=open，S2=ｂ，S3=ａ，S4=ｂ）とＥＦＰ
（S1=open，S2=ｂ，S3=ｂ，S4=ａ）とＥＢＰ（前述した
ようなスイッチ位置）の間で比較され、各マクロブロッ
クＭＢ毎に最も有利な方式が選択される。

【００３９】様々なブロックサイズの適用マクロブロックの可能な分割は、ビデオ符号化規格Ｈ．
２６ＬのテストモデルＴＭＬ−３において提案された分
割に基づいている（例えば公知文献“Telecom．Standar
dization Sector of ITU, H.26L test model long term
3, in study Group 16, Question 15, Meeting J. (Os
aka, Japan), ITU, Mar. 2000”参照）。マクロブロッ
クは、図３に示されているように、下位ブロックに分解
される。それにより、１６×１６、１６×８、８×１
６、８×８、８×４、４×８、４×４ピクセルのサイズ
の下位ブロックが生じる。エンハンスレイヤにおいては
４つのマクロブロックが高度補完されたベースレイヤに
相応する。ベースレ

【００４０】

【外１１】

【００４１】図４には、対応する補完されたベースレイ
ヤブロックＭＢ′_Ｂｎの分割に依存したエンハンスレイ
ヤの４つのマクロブロックＭＢ_Ｅｎ（i,j）(i,j={0,
1}）の分割が、概略的に示されており、この場合は特に
対応するベースレイヤマクロブロックにおいて図３の分
割６が選択されているケースでエンハンスレイヤマクロ
ブロックに対して可能な４つの分割が示されている。

【００４２】エンハンスレイヤマクロブロックに対する
分割は、符号化すべき予測誤差が可及的に小さくなるよ
うに選択される。それに対しては、求められた動きベク
トル

【００４３】

【外１２】

【００４４】本発明による方法は、Ｈ.２６Ｌに準拠し
た画像シーケンスの局所的階層符号化への適用に適して
いる。

【００４５】ＥＢＰで符号化されたマクロブロックに対
しては、マクロブロックヘッダにおいてシグナリングさ
れる必要があるが、その他では動きベクトルは符号化さ
れない。

【図面の簡単な説明】

【図１】ベースレイヤの符号化とエンハンスレイヤの符
号化のための手段のブロック回路図である。

【図２】エンハンスレイヤにおける動き予測のための変
位ベクトルの探索を示した図である。

【図３】マクロブロックの可能な分割を示した図であ
る。

【図４】エンハンスレイヤにおける４つのマクロブロッ
クの分割を示した図である。

【符号の説明】

Ｓ１,Ｓ２,Ｓ３,Ｓ４スイッチＭＥ動き予測段ＭＣ動き補償段Ｑ量子化段Ｇ（ｚ）補間フィルタＴＲ変換段

───────────────────────────────────────────────────── フロントページの続きＦターム(参考） 5C059 KK00 LC08 LC09 MA05 MA23 MA32 MC11 NN01 NN21 NN28 PP04 RC11 TA12 TA21 TC18 TD11 UA02 UA05 5J064 AA02 BA01 BB03 BB04 BC25 BD01

Claims

【特許請求の範囲】

【請求項１】種々異なる局所的解像度ないし分解能の
少なくとも２つの段（ＥＬ，ＢＬ）における動画の局所
的階層符号化方法において、動き予測を、局所的高分解能段ＥＬに対して目下の画像
信号と参照画像信号の補間されたバージョンに基づいて
実施し、この場合参照画像信号として、時間的に事前に
求められたか伝送された画像信号が用いられることを特
徴とする方法。
【請求項２】局所的高分解能段に対する変位ベクトル
が符号器側と復号器側で既に既知の情報から求められ、
それによってサブ情報として復号器に伝送する必要のな
いようにした、請求項１記載の方法。
【請求項３】サブ情報の非伝送によって節約された符
号化コストが実質的に予測誤差の符号化のために用いら
れる、請求項２記載の方法。
【請求項４】局所的低分解能段ＢＬの既に伝送された
モカの画像信号が、サンプリングレートと補間フィルタ
リングの引上げによって局所的高分解能段ＥＬのサイズ
と分解能にもたらされ、前記高分解能段ＥＬの参照画像
信号と動き予測のために比較される、請求項１から３い
ずれか１項記載の方法。
【請求項５】参照画像信号は、低域ろはフィルタリン
グを施される、請求項１から４いずれか１項記載の方
法。
【請求項６】前記変位ベクトルが、目下の符号化すべ
き高分解能の画像信号の動き補償予測ＢＫＰのために用
いられる、請求項１から５いずれか１項記載の方法。
【請求項７】動き補償予測のための参照基準として、
時間的に事前に求められたかあるいは伝送された画像信
号が用いられる、請求項６記載の方法。
【請求項８】動き予測ＭＥがブロックベースで行われ
る、請求項１から７いずれか１項記載の方法。
【請求項９】前記方法がエンハンスイントラ予測方式
及び/又はエンハンスインター予測方式と並行して適用
される、請求項１から８いずれか１項記載の方法。
【請求項１０】複数の下位ブロックへのブロックの分
割の際に、最適なブロック分割情報がサブ情報として受
信器側に転送される、請求項８または９記載の方法。