JP2006501750A - ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム - Google Patents

ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム Download PDF

Info

Publication number
JP2006501750A
JP2006501750A JP2004541056A JP2004541056A JP2006501750A JP 2006501750 A JP2006501750 A JP 2006501750A JP 2004541056 A JP2004541056 A JP 2004541056A JP 2004541056 A JP2004541056 A JP 2004541056A JP 2006501750 A JP2006501750 A JP 2006501750A
Authority
JP
Japan
Prior art keywords
region
frame
pixel values
unfiltered
filtered
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004541056A
Other languages
English (en)
Inventor
ディーパク エス トゥラガ
デル スカール ミハエラ ファン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2006501750A publication Critical patent/JP2006501750A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • H04N19/573Motion compensation with multiple frame prediction using two or more reference frames in a given prediction direction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

本発明は、ビデオを符号化する方法及び装置に関する。本発明によれば、第1のフレームにおける第1の領域は、第2のフレームにおける第2の領域にマッチングしている。前記第1の領域のピクセル値と、前記第2の領域のピクセル値との間の差異を含む第1の部分的に符号化されたフレームが生成される。前記第1の領域又は前記第2の領域の一方のピクセル値を含む第2の部分的に符号化されたフレームが生成される。さらに、これら第1及び第2の部分的に符号化されたフレームはウェーブレット係数に変換される。

Description

本出願は、2002年7月15日出願の米国予備出願番号60/395,921の利益を述べてあり、この出願が教えていることは参照することによりこれに含まれるものとする。
本発明は一般的にビデオ圧縮に関することであり、特にフィルタリングされた領域と、フィルタリングされない領域とを共に備えるLフレームを生成する動き補償された時間フィルタリングを利用するウェーブレット(wavelet)ベースの符号化に関する。
多くの現在のビデオ符号化アルゴリズムは、動き補償された予測符号化に基づいてあり、これらアルゴリズムはハイブリッド方式とみなされている。このようなハイブリッド方式において、時間的冗長が動き補償を用いて減少する一方、空間的冗長は前記動き補償の残余を変換符号化することにより減少する。通常用いられる変換は離散コサイン変換(DCT)又はサブバンド/ウェーブレット分解を含んでいる。しかしながら、このような方式は、本当のスケーラブルなビットストリームを供給する点において柔軟性を欠いている。
3Dサブバンド/ウェーブレット(以後は“3Dウェーブレット”)ベースの符号化として知られる他の形式の方式は、ヘテロジーニアスなネットワーク(heterogeneous network)を介するビデオ通信の現在のシナリオにおいて特に人気を得ている。これら方式は、非常に柔軟なスケーラブルビットストリーム及び高いエラー耐性が提供されるので、上記アプリケーションにおいて好ましい。3Dウェーブレット符号化において、全フレームは、DCTベースの符号化ではブロック毎である代わりに、一度に変換される。
3Dウェーブレット方式の1つの構成要素は、動き補償された時間フィルタリング(MCTF)であり、これは時間的冗長を減少させるために行われる。MCTFの一例は、Seung-Jong Choi及びJohn Woods著、タイトル”Motion-Compensated 3-D Subband Coding of Video”, IEEE Transactions On Image Processing, Volume 8, No. 2, February 1999の論文に記載されてあり、以後”Woods”と呼ぶ。
Woodsにおいて、フレームは、空間分解が行われる前に、動きの方向に時間フィルタリングされる。この時間フィルタリング中、幾つかのピクセルは、その場面における動きの性質及びオブジェクトをカバーしている/カバーしていないによって、参照されなかったり又は何度も参照されたりする。このようなピクセルは不連続(unconnected)ピクセルとして知られ、特別な処理を必要とする。これが減少した符号化効率となってしまう。Woodsから引用された不連続又は接続ピクセルの一例が図1に示される。
本発明は、ビデオを符号化するための方法及び装置を述べている。本発明によれば、第1のフレームにおける第1の領域が第2のフレームにおける第2の領域にマッチングする。第1の領域のピクセル値と第2の領域のピクセル値との間の差異を含む第1の部分的に符号化されたフレームが生成される。第1の領域又は第2の領域のどちらか一方のピクセル値を含む第2の部分的に符号化されたフレームが生成される。さらに、第1及び第2の部分的に符号化されたフレームはウェーブレット係数に変換される。
ある実施例において、第1の領域又は第2の領域のどちらか一方のピクセル値を含む前記第2の部分的に符号化されたフレームは、前記第1の領域と前記第2の領域との間のマッチングの質が既定のしきい値よりも大きい場合に生成される。他の実施例において、前記第1の領域又は第2の領域のどちらか一方のピクセル値を含む前記第2の部分的に符号化されるフレームは、第2の部分的に復号されたフレームを符号化するためのビットの数が、前記第2の部分的に符号化されたフレームに含まれる前記第1の領域及び第2の領域のピクセル値の平均の場合よりも小さい場合に生成される。
本発明はビットストリームを復号するための方法及び装置を述べている。本発明によれば、このビットストリームはウェーブレット係数を生成するためにエントロピー復号される。
ウェーブレット係数は、フィルタリングされた領域を含む第1の部分的に復号されるフレームと、フィルタリングされない領域を含む第2の部分的に復号されるフレームとに変換される。加算又は減算のどちらか一方により、フィルタリングされた領域及びフィルタリングされない領域のピクセル値を合わせて含む第1のフレームが生成される。さらに、前記フィルタリングされない領域のピクセル値を含む第2のフレームが生成される。
ここで図を参照してみると、同じ参照番号は、図を通じて対応する部分を示している。
前述したように、3Dウェーブレット方式の1つの構成要素は、動き補償された時間フィルタリング(MCTF)であり、これは時間的冗長を減少させるために行われる。従来のMCTFにおいて、フレームはペアでフィルタリングされる。特にフレームの各ペア(A,B)は、フレームの各ペアにおいて同様の領域をマッチングさせる動きベクトル(V,V)を用いて、フィルタリングされ、
Figure 2006501750
Figure 2006501750
のようなL及びHフレームのペアとなる。
数式(1)において、Lは各ペアのスケーリングされた平均に対応し、cはスケーリング因子を表す。数式(2)において、Hは各ペアのスケーリングされた差異に対応し、cはスケーリング因子を表す。Lフレームが時間平均されたフレームを表しているので、通常これらLフレームは、ビデオが低いフレームレートで復号される場合にだけ表示される。これにより、復号されたLフレームに生成される如何なるアーチファクトも低いフレームレートでの低品質なビデオ品質となってしまうので、Lフレームは良好な品質のビデオ品質にすべきである。
Lフレームの品質は通常、動き推定の品質が良い、すなわち良好なマッチングが見られる場合、かなり良好である。しかしながら、ビデオシーケンスにおいて2つのフレーム間の領域に対し良好なマッチングが見つからない場合がある。このような場合は、場面の転換、素早い動き又は特定の場面においてオブジェクトをカバーする及びカバーしないことを含んでいる。これにより、本発明によれば、悪いマッチングに対応するLフレームの部分はフィルタリングされないままであり、これら部分はA領域と規定される。これは、良好なマッチングが見つけられなくても、これら領域の視覚的品質に影響しないことを可能にする。さらに、悪いマッチング領域にわたりフィルタリングを行わないことにより、符号化効率が改善されることも可能である。
本発明による時間フィルタリングの一例が図2に示される。
本実施例において、L及びH領域が生成されるようにフィルタリングされた2つの(網掛された)領域が示される。さらに、A及びH領域が生成されるようにフィルタリングされた他の2つの(網掛されていない)領域が示される。前述したように、A領域はフィルタリングされないままにしてあるフレームの一部である。L領域はフィルタリング中にスケーリングされるので、同じ大きさとなるために、フィルタリングされないA領域もスケーリングする必要がある。A領域のこのスケーリングは、
Figure 2006501750
と表される。
本発明による符号化器の一例が図3に示される。分かるように、符号化器は入力ビデオをGOP(group of picture)に分割するための分割ユニット(partitioning unit)2を含み、これらGOPは1つの単位として符号化される。本発明によれば、分割ユニット2は、前記GOPが既定数のフレームを含む、又は動作中に例えば帯域幅、符号化効率のようなパラメタと、ビデオコンテンツとに基づいて動的に決められるように動作する。例えば、ビデオが素早い場面転換及び早い動きからなる場合、短いGOPを持つことがより効率的である一方、前記ビデオが主に静止したオブジェクトからなる場合、長いGOPを持つことがより効率的である。
分かるように、動き推定ユニット6及び時間フィルタリングユニット8で構成されるMCTFユニット4が含まれている。動作中、各GOPのフレームはペアで処理される。ここでこれらペアの各々はソースフレーム及び基準フレームを含んでいる。これにより、動き推定ユニット6は、ソースフレームの各々における領域を基準フレームの各々における同様の領域にマッチングさせる。ある実施例において、動き推定ユニット6は後方予測を行う。これにより、この実施例では、ソースフレームは後のフレームであり、基準フレームは前のフレームである。他の実施例において、動き推定ユニット6は前方予測を行う。これにより、この実施例では、ソースフレームは前のフレームであり、基準フレームは後のフレームである。上述したマッチングの結果として、動き推定ユニット6は、動きベクトルMV及び処理されている現在のフレームにマッチングする各領域に対するフレーム番号を供給する。
動作中、時間フィルタリングユニット8は、フレームの各ペア間における時間的冗長を取り除く。これを行うために、この時間フィルタリングユニット8は、動き推定ユニット6により供給される動きベクトル及びフレーム基準番号に従い、フレームの各ペアに対しマッチングする2つの対応する領域の各々を取り出す。この時間フィルタリングユニット8は次いで、処理されているフレームの各ペアに対するLフレーム及びHフレームを生成する。
Hフレームを生成するために、時間フィルタリングユニット8は、フレームの各ペアに対する2つの対応するマッチングした各領域に対するピクセル値の間の差異を計算する。好ましくは、この差異はスケーリング因子により乗算される。適切なスケーリング因子の例は、2の平方根の逆数(1/√2)を含んでいる。
Lフレームを生成するために、時間フィルタリングユニット8は、フレームの各ペアに対する2つの対応するマッチングした領域の各々に対し、フィルタリングされないA領域であるべきか、又はL領域としてフィルタリングされるべきかを判断する。L領域であるべきだと判断された2つの対応するマッチングした領域の各々に対し、時間フィルタリングユニット8は、2つの領域のピクセル値の平均を計算する。好ましくは、これら2つの領域の平均は、スケーリング因子により乗算される。適切なスケーリング因子の例は、2の平方根(√2)を含む。
A領域であるべきだと判断された2つの対応するマッチングした領域の各々に対し、時間フィルタリングユニット8は、各Lフレームに含まれるべき2つの領域の一方の領域のピクセル値を選択する。好ましくは、この時間フィルタリングユニット8は、基準フレームから前記領域を選択する。しかしながら、本発明によれば、前記領域がソースフレームから選択されてもよい。適切な復号を保証するために、各A領域が基準フレーム又はソースフレームのどちらから選択されたかを復号器に知らせる必要がある。これは、各Lフレームに関連する何らかの種類のフラグ又はヘッダにより達成される。さらに、この選択された領域がスケーリング因子により乗算されることも好ましい。適切なスケーリング因子の例は、2の平方根の逆数(1/√2)を含む。
上述したように、時間フィルタリングユニット8は、フレームの各ペアにおける2つの対応するマッチングした領域の各々に対し、A領域であるべきか、又はL領域としてフィルタリングされるべきかを判断する。本発明によれば、これは数多くの異なるやり方で行われる。ある実施例において、これは2つの対応する領域間におけるマッチングの質に基づいて判断される。このマッチングの質は、マッチング表示の質を用いることにより判断されてよい。適切なマッチング表示の質は、2つの対応するマッチングする領域間のMAD(mean absolute difference)又はMSE(mean squared error)を含む。2つのN×N領域xij及びyij間のMADは、絶対ピクセル差の平均により、
Figure 2006501750
と計算される。
この数式(4)によれば、MAD値が小さくなれば、2つの領域間の差異は小さくなることを示し、これら2つの領域は良好にマッチングされていると分析される。この値はシーケンス依存であり、低い動きシーケンスは、平均して小さなMAD値を持ち、高い動きシーケンスは、大きな平均MADを持つ。平均して、理にかなった良質のマッチングは、5よりも小さいMAD値を持つ。これにより、このしきい値は、これら2つの対応するマッチングした領域の各々が良好なマッチングであるかを判断するのに用いられる。MAD値が5よりも小さい場合、これら特定の2つの対応するマッチングした領域は、L領域としてフィルタリングされる。MAD値がこのしきい値よりも大きい場合、これら特定の2つのマッチングした領域は、A領域としてフィルタリングされない。
他の実施例において、これら2つの対応するマッチングした領域の各々がA領域であるべきか、又はLフレームを符号化するのに要するビット数に基づいて、L領域としてフィルタリングされるべきかを判断する。特に、これら対応するマッチングした領域の各々に対し、A領域を備える及びA領域を備えない各Lフレームを符号化するのに必要とされるビット数が計算される。A領域を備えたLフレームのビット数の方が少ない場合、これら特定の対応するマッチングした領域はL領域としてフィルタリングされる。この例において、符号化効率は高まる。
Lフレームを符号化するのに要するビット数は、使用される特定のエントロピー符号化技術により影響が及ぼされる。例えば、EZBC(embedded zerotree block coding)技術は、ウェーブレットベースのビデオ符号化器に対し人気のあるエントロピー符号化技術である。このような方式が持つ特徴の1つは、分散化したデータを持つ領域に対して、局所化したデータを持つ領域を符号化するのに数ビットしか必要としないことである。変換された係数(時間フィルタリング及び空間分解後)が非零係数を僅かしか持たない多くの広域エリアでクラスタ化される場合、EZBCはデータを圧縮するのに僅かなビットしか必要としない。他方、これら係数が分散化している場合、EZBCは多くのビットを必要とする。これにより、これら2つの対応するマッチングした領域の各々がA領域としてフィルタリングされないままでいるか、又はL領域としてフィルタリングされるかの判断は、使用されるエントロピー符号化技術に依存して異なる。
上述されるMCTFも不連続ピクセルを生成してよい。これにより、時間フィルタリングユニット8はWoodsに記載されるような、これら不連続ピクセルを扱う。
分かるように、空間分解ユニット10は、MCTFユニット4により供給されるフレームにおける空間的冗長を減少させるために含まれる。動作中、MCTFユニット4から入力されるフレームは、2Dウェブレット変換に従って、ウェーブレット係数に変換される。このウェーブレット変換のフィルタ及び実施は、多くの形式がある。
適切な2Dウェーブレット変換の一例が図4に示される。分かるように、フレームは、ウェーブレットフィルタを用いて低周波のサブ帯域及び高周波のサブ帯域に分解される。これは2D変換であるため、3つの周波数のサブ帯域(水平、垂直及び対角線)が存在する。低周波のサブ帯域は、(水平周波数及び垂直周波数の両方において低い)LLサブ帯域と名付けられる。これら高周波のサブ帯域は、LH、HL及びHHと名付けられ、水平方向に高い周波数、垂直方向に高い周波数、水平及び垂直の両方向に高い周波数に対応する。低い周波数のサブ帯域はさらに再帰的に分解される。図3において、WTはウェーブレット変換を表している。Stephane Mallet著、タイトル”A
Wavelet Tour of Signal Processing”, Academic Press, 1997の書籍に記載される他の知られたウェーブレット変換がある。
図3に戻り参照すると、符号化器は有意情報(significance information)に従って、空間分解ユニット10の出力を符号化するための有意符号化ユニット12も含む。本実施例において、有意とは、ウェーブレット係数の大きさを表し、ここで大きい係数は小さい係数よりも有意である。本実施例において、有意符号化ユニット12は、空間分解ユニット10から入力されるウェーブレット係数を眺め、次に大きさに従ってこれらウェーブレット係数を再整列させる。これにより、最大の大きさを持つウェーブレット係数が最初に送られる。有意符号化の一例は、SPIHT(Set Partitioning in
Hierarchical Trees)である。これは、A. Said及びW.
Pearlman著、タイトル”A New Fast and Efficient Image Codec
Based on Set Partitioning in Hierarchical Trees”, IEEE Transactions on Circuits
and Systems for Video Technology, vol.6, June 1996の文献に記載されている。
図3から分かるように、破線は幾つかの動作間における依存状態を示すために含まれている。ある例において、動き推定6は有意符号化ユニット12の特質に依存している。例えば、この動き推定により生成される動きベクトルは、どのウェーブレット係数がより有意であるかを判断するのに用いられる。他の例において、空間分解ユニット10が有意符号化ユニット12の形式に依存してもよい。例えば、ウェーブレット分解のレベル数が有意係数の数に関係してもよい。
さらに分かるように、エントロピー符号化ユニット14は出力ビットストリームを生成するために含まれる。動作中、エントロピー符号化技術は、ウェーブレット係数を出力ビットストリームに符号化するのに利用される。このエントロピー符号化技術は、動き推定ユニット6により供給される動きベクトル及びフレーム番号にも利用される。復号を可能にするために、この情報は出力ビットストリームに含まれる。適当なエントロピー符号化技術の実施例は可変長符号化及び算術符号化を含んでいる。
本発明による復号器の一例が図5に示されている。図3に関して前述されたように、入力ビデオはGOPに分割され、各GOPは1つの単位として符号化される。これにより、入力ビットストリームは、1つの単位としても復号されるGOPを1つ以上含んでいる。ビットストリームは、動き補償された時間フィルタリングを事前に行ったGOPにおける各フレームに対応する多数の動きベクトルMV及びフレーム番号も含んでいる。
分かるように、復号器は入力するビットストリームを復号するためのエントロピー復号ユニット16を含む。動作中、この入力ビットストリームは、符号器側で行われたエントロピー符号化技術の逆に従って復号される。このエントロピー復号は、各GOPに対応するウェーブレット係数を生成する。さらに、エントロピー復号は、後で利用される多数の動きベクトル及びフレーム番号を生成する。有意復号ユニット18は、有意情報に従ってエントロピー復号ユニット16からのウェーブレット係数を復号するために含まれる。これにより、動作中、ウェーブレット係数は、符号器側で用いられた技術の逆を用いることにより、正しい空間順序に従って再整列される。
さらに分かるように、空間再構成ユニット20は、有意復号ユニット18からのウェーブレット係数を空間的に復号されたフレームに変換するために含まれる。動作中、各GOPに対応するウェーブレット係数は、符号器側で行われた2Dウェーブレット変換の逆に従って変換される。これは、本発明従って、動き補償された時間フィルタリングを行った部分的に復号されたフレームを生成する。前述したように、この動き補償された時間フィルタリングは、処理されるフレームの各ペアに対しHフレーム及びLフレームのペアを生成する。さらに、本発明によれば、Lフレームは、前述されたように、フィルタリングされないA領域とフィルタリングされたL領域との両方を含んでいる。
逆の時間フィルタリングユニット22は、空間再構成ユニット20からの部分的に復号されたフレームを復元するために含まれている。動作中、この逆の時間フィルタリングユニット22は、以下のように、各GOPに含まれるHフレーム及びLフレームの各ペアを処理する。最初に、H及びLフレームの各ペアにおける対応する領域がエントロピー復号ユニット16により供給される動きベクトル及びフレーム番号に従って取り出される。本発明によれば、取り出された対応する領域の各々は、LフレームからのL領域又はA領域の一方と、Hフレームからの領域とを含む。前述したように、A領域はフレームのペア間における2つの対応するマッチングした領域の一方の領域のフィルタリングされないピクセル値を表し、L領域はこれら2つの対応するマッチングした領域のピクセル値の平均を表し、Hフレームからの領域はこれら2つの対応するマッチングした領域間の差異を表す。さらに、取り出された対応する領域は、符号化器側で用いられた同じスケーリング因子により分割される。
Lフレームに含まれる各L領域に対し、各L領域及びHフレームにおける対応する領域のピクセル値に対する和及び差が計算される。各和及び差は、次いで他のスケーリング因子により分割される。適切なスケーリング因子の一例は、2の値である。各スケーリングされた和及び差は次いで、適切な再構成されたフレームに置かれる。
Lフレームに含まれる各A領域に対し、上述されたように、各領域は最初にスケーリングされた後、前記適切な再構成されたフレームにそのまま送られる。前述されたように、各Lフレームは、特定のA領域が基準フレーム又はソースフレームのどちらから選択されたかを示す関連するヘッダ又はフラグを持ってもよい。これにより、各A領域は、これら関連するヘッダ又はフラグに関する情報に従って、適切な再構成されたフレームに置かれる。代わりに、A領域が既定される規則に従って前記適切なフレームに置かれてもよい。例えば、全ビデオシーケンスに対し基準フレームから全てのA領域を選択すると決めることができる。
さらに、各A領域に対するピクセル値もHフレームにおける対応する領域からのピクセル値と結合される。本発明によれば、これらピクセルの結合は、加算又は減算の一方により行われる。例えば、後方予測が復号器側且つ基準フレームから生じたA領域において用いられる場合、減算が好ましい。代わりに、後方予測が符号器側且つソースフレームから生じたA領域において用いられる場合、加算が好ましい。このA領域をHフレームにおける領域と結合することで得られる値の各々は次いで、前記適切な再構成されたフレームに置かれる。
本発明によるフィルタリングされた領域及びフィルタリングされない領域の両方を備えるLフレームを生成する動き補償された時間フィルタリングを利用して、ウェーブレットベースの符号化が実施されるシステムの一例が図6に示される。例として、このシステムはテレビジョン、セットトップボックス、デスクトップ、ラップトップ又はパームトップコンピュータ、PDA、例えばVCR、DVR、TiVO装置等のようなビデオ/画像記憶装置、並びにこれら及び他の装置の一部又は組み合わせたものを表す。このシステムは、1つ以上のビデオソース26、1つ以上の入力/出力装置34、プロセッサ28、メモリ30及びディスプレイ装置36を含む。
ビデオ/画像ソース26は、例えばテレビジョン受信器、VCR又は他のビデオ/画像記憶装置を表す。このソース26は代わりに、インターネット、WAN、MAN(metropolitan area network)、LAN、地上波放送システム、ケーブルネットワーク、衛生ネットワーク、無線ネットワーク又は電話ネットワーク並びにこれら及び他の形式のネットワークの一部又は組み合わせたものである広域コンピュータ通信ネットワークを介してサーバからビデオを入力するための1つ以上のネットワーク接続を表す。
入力/出力装置34、プロセッサ28及びメモリ30は、通信媒体32を介して通信する。この通信媒体32は例えばバス、通信ネットワーク、回路、回路カード又は他の装置の1つ以上の内部接続、並びにこれら及び他の通信媒体の一部及び組み合わせたものを表す。ソース26からの入力ビデオデータは、ディスプレイ装置36に供給される出力ビデオ/画像を生成するために、メモリ30に記憶され、プロセッサ28により実行される1つ以上のソフトウェアプログラムに従い処理される。
特に、メモリ30に記憶されるソフトウェアプログラムは、図3及び図5に関して前述されたように、ウェーブレットベースの符号化を含んでいる。本実施例において、このウェーブレットベースの符号化は、前記システムにより実行されるコンピュータ読み取り可能コードにより実施される。このコードはメモリ30に記憶されるか、又はCD−ROM若しくはフロッピーディスク(登録商標)のような記憶媒体から読み取り/ダウンロードされてよい。他の実施例において、ハードウェア回路は、本発明を実施するソフトウェア命令の代わりに又は組み合わせて使用されてよい。
本発明が特定の実施例に関して上述した一方、本発明がここで開示された実施例に限定される又は制限されることを意図していないと理解されるべきである。それ故に、本発明は、請求項における意図及び範囲内に含まれる様々な構造及びこれら構造の変形を含むことを意味する。
既知の動き補償された時間フィルタリング技術の態様を説明する図。 本発明による時間フィルタリングの実施例を説明する図。 本発明による符号化器の実施例を説明するブロック図。 2Dウェーブレット変換の実施例を説明するブロック図。 本発明による復号器の実施例。 本発明によるシステムの実施例。

Claims (21)

  1. ビデオを符号化する方法において、
    −第1のフレームにおける第1の領域を第2のフレームにおける第2の領域にマッチングさせるステップと、
    −前記第1の領域のピクセル値と前記第2の領域のピクセル値との間の差異を含む第1の部分的に符号化されたフレームを生成するステップと、
    −前記第1の領域又は前記第2の領域のどちらか一方のピクセル値を含む第2の部分的に符号化されたフレームを生成するステップと、
    −前記第1及び前記第2の部分的に符号化されたフレームをウェーブレット係数に変換するステップと、
    を有する方法。
  2. 有意情報に従って前記ウェーブレット係数を符号化するステップをさらに有する請求項1に記載の方法。
  3. 前記ウェーブレット係数をエントロピー符号化するステップをさらに有する請求項1に記載の方法。
  4. 前記第1の領域のピクセル値と前記第2の領域のピクセル値との間の前記差異をスケーリング因子により乗算するステップをさらに有する請求項1に記載の方法。
  5. 前記第1の領域又は前記第2の領域のどちらか一方の前記ピクセル値をスケーリング因子により乗算するステップをさらに有する請求項1に記載の方法。
  6. 請求項1に記載の方法において、
    −前記第1のフレームにおける第3の領域を前記第2のフレームにおける第4の領域にマッチングさせるステップと、
    −前記第3及び前記第4の領域のピクセル値の平均を前記第2の部分的に符号化されたフレームに含むステップと、
    をさらに有する方法。
  7. 前記第3及び前記第4の領域のピクセル値の前記平均をスケーリング因子により乗算するステップをさらに有する請求項6に記載の方法。
  8. 前記第1又は前記第2の領域のどちらか一方のピクセル値を含む前記第2の部分的に符号化されたフレームを生成するステップは、マッチング表示の質が既定のしきい値よりも大きい場合に行われる請求項1に記載の方法。
  9. 前記第1又は前記第2の領域のどちらか一方のピクセル値を含む前記第2の部分的に符号化されたフレームを生成するステップは、前記第2の部分的に復号されたフレームを符号化するためのビット数が、前記第1及び前記第2の領域のピクセル値の平均が前記第2の部分的に符号化されたフレームに含まれる場合よりも少ないとき行われる請求項1に記載の方法。
  10. ビデオを符号化するコードを含む記憶媒体において、前記コードは、
    −第1のフレームにおける第1の領域を第2のフレームにおける第2の領域にマッチングさせるコードと、
    −前記第1の領域のピクセル値と前記第2の領域のピクセル値との間の差異を含む第1の部分的に符号化されたフレームを生成するコードと、
    −前記第1の領域又は前記第2の領域のどちらか一方のピクセル値を含む第2の部分的に符号化されたフレームを生成するコードと、
    −前記第1及び前記第2の部分的に符号化されたフレームをウェーブレット係数に変換するコードと、
    を有する記憶媒体。
  11. ビデオを符号化する装置において、
    −第1のフレームにおける第1の領域を第2のフレームにおける第2の領域にマッチングさせる動き推定ユニットと、
    −前記第1の領域のピクセル値と前記第2の領域のピクセル値との間の差異を含む第1の部分的に符号化されるフレーム、及び前記第1又は前記第2の領域のどちらか一方のピクセル値を含む第2の部分的に符号化されるフレームを生成する時間フィルタリングユニットと、
    −前記第1及び前記第2の部分的に符号化されるフレームをウェーブレット係数に変換する空間分解ユニットと、
    を有する装置。
  12. ビットストリームを復号する方法において、
    −前記ビットストリームをエントロピー復号して、ウェーブレット係数を生成するステップと、
    −前記ウェーブレット係数をフィルタリングされた領域を含む第1の部分的に復号されるフレーム、及びフィルタリングされない領域を含む第2の部分的に復号されるフレームに変換するステップと、
    −前記フィルタリングされた領域及び前記フィルタリングされない領域のピクセル値を合わせて含む第1のフレームを生成するステップと、
    −前記フィルタリングされない領域の前記ピクセル値を含む第2のフレームを生成するステップと、
    を有する方法。
  13. スケーリング因子により前記フィルタリングされた領域を分割するステップをさらに有する請求項12に記載の方法。
  14. スケーリング因子により前記フィルタリングされない領域を分割するステップをさらに有する請求項12に記載の方法。
  15. 前記フィルタリングされた領域及び前記フィルタリングされない領域のピクセル値は、減算することにより結合される請求項12に記載の方法。
  16. 前記フィルタリングされた領域及び前記フィルタリングされない領域のピクセル値は、加算することにより結合される請求項12に記載の方法。
  17. 前記フィルタリングされない領域は、2つのマッチングした領域のうち一方の領域のピクセル値を含んでいる請求項12に記載の方法。
  18. 前記フィルタリングされた領域は、2つのマッチングした領域からのピクセル値の差異を含んでいる請求項12に記載の方法。
  19. 有意情報に従って前記ウェーブレット係数を復号するステップをさらに有する請求項12に記載の方法。
  20. ビットストリームを復号する装置において、
    −前記ビットストリームをウェーブレット係数に復号するエントロピー復号ユニットと、
    −前記ウェーブレット係数をフィルタリングされた領域を含む第1の部分的に復号されるフレーム、及びフィルタリングされない領域を含む第2の部分的に復号されるフレームに変換する空間再構成ユニットと、
    −前記フィルタリングされる領域及び前記フィルタリングされない領域の前記ピクセル値を合わせて含む第1のフレーム、及び前記フィルタリングされない領域の前記ピクセル値を含む第2のフレームを生成する逆の時間フィルタリングユニットと、
    を有する装置。
  21. ビットストリームを復号するコードを含む記憶媒体において、前記コードは、
    −前記ビットストリームをエントロピー復号し、ウェーブレット係数を生成するコードと、
    −前記ウェーブレット係数をフィルタリングされた領域を含む第1の部分的に復号されたフレーム、及びフィルタリングされない領域を含む第2の部分的に復号されたフレームに変換するコードと、
    −前記フィルタリングされた領域及び前記フィルタリングされない領域の前記ピクセル値を合わせて含む第1のフレームを生成するコードと、
    −前記フィルタリングされない領域の前記ピクセル値を含む第2のフレームを生成するコードと、
    を有する記憶媒体。
JP2004541056A 2002-10-04 2003-09-22 ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム Withdrawn JP2006501750A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/264,901 US20040008785A1 (en) 2002-07-15 2002-10-04 L-frames with both filtered and unfilterd regions for motion comensated temporal filtering in wavelet based coding
PCT/IB2003/004135 WO2004032059A1 (en) 2002-10-04 2003-09-22 L-frames with both filtered and unfiltered regions for motion-compensated temporal filtering in wavelet-based coding

Publications (1)

Publication Number Publication Date
JP2006501750A true JP2006501750A (ja) 2006-01-12

Family

ID=32068302

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004541056A Withdrawn JP2006501750A (ja) 2002-10-04 2003-09-22 ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム

Country Status (7)

Country Link
US (1) US20040008785A1 (ja)
EP (1) EP1552478A1 (ja)
JP (1) JP2006501750A (ja)
KR (1) KR20050049517A (ja)
CN (1) CN1689045A (ja)
AU (1) AU2003260897A1 (ja)
WO (1) WO2004032059A1 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100782829B1 (ko) 2003-06-10 2007-12-06 렌슬러 폴리테크닉 인스티튜트 움직임 보상 시간 필터링에서 i-블록들을 처리하는 방법
US8107535B2 (en) 2003-06-10 2012-01-31 Rensselaer Polytechnic Institute (Rpi) Method and apparatus for scalable motion vector coding
FR2867329A1 (fr) * 2004-03-02 2005-09-09 Thomson Licensing Sa Procede de codage d'une sequence d'images par analyse temporelle hierarchique.
KR20060043051A (ko) * 2004-09-23 2006-05-15 엘지전자 주식회사 영상 신호의 인코딩 및 디코딩 방법
US8279918B2 (en) 2005-07-15 2012-10-02 Utc Fire & Security Americas Corporation, Inc. Method and apparatus for motion compensated temporal filtering using residual signal clipping
US8483277B2 (en) 2005-07-15 2013-07-09 Utc Fire & Security Americas Corporation, Inc. Method and apparatus for motion compensated temporal filtering using split update process
US9672584B2 (en) * 2012-09-06 2017-06-06 Imagination Technologies Limited Systems and methods of partial frame buffer updating

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5317397A (en) * 1991-05-31 1994-05-31 Kabushiki Kaisha Toshiba Predictive coding using spatial-temporal filtering and plural motion vectors
US5363097A (en) * 1992-09-14 1994-11-08 Industrial Technology Research Institute Direct sequential-bit variable length decoder
JP2902284B2 (ja) * 1993-11-12 1999-06-07 ケイディディ株式会社 動画像の符号化装置
ATE223135T1 (de) * 1996-04-19 2002-09-15 Nokia Corp Videokodierer und -dekodierer mit bewegungsbasierter bildsegmentierung und bildzusammenfügung
JP3518717B2 (ja) * 1996-09-20 2004-04-12 ソニー株式会社 動画像符号化装置および方法、並びに動画像復号化装置および方法
US6414992B1 (en) * 1999-01-27 2002-07-02 Sun Microsystems, Inc. Optimal encoding of motion compensated video
EP1277347A1 (en) * 2000-04-11 2003-01-22 Koninklijke Philips Electronics N.V. Video encoding and decoding method

Also Published As

Publication number Publication date
US20040008785A1 (en) 2004-01-15
WO2004032059A1 (en) 2004-04-15
EP1552478A1 (en) 2005-07-13
CN1689045A (zh) 2005-10-26
KR20050049517A (ko) 2005-05-25
AU2003260897A1 (en) 2004-04-23

Similar Documents

Publication Publication Date Title
US7042946B2 (en) Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
US7023923B2 (en) Motion compensated temporal filtering based on multiple reference frames for wavelet based coding
JP2005524352A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を用いたスケーラブルなウェーブレット・ベースの符号化
EP1825690B1 (en) Method and system for decomposing multiview videos
KR101183304B1 (ko) Sdmctf 인코딩된 비디오의 3d 부-대역 디코딩에서의 공간 확장성
US8817872B2 (en) Method and apparatus for encoding/decoding multi-layer video using weighted prediction
US20060088096A1 (en) Video coding method and apparatus
JP4587321B2 (ja) インタレースデジタルビデオデータのスケーラブル符号化および復号化
EP1737243A2 (en) Video coding method and apparatus using multi-layer based weighted prediction
JP2004502358A (ja) ビデオ系列の圧縮のための符号化方法
WO2004036919A1 (en) Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering
JP4382284B2 (ja) サブバンドの符号化/復号
JP2005516494A (ja) ドリフトフリー映像符合化及び復号化方法並びに対応する装置
JP2005515729A (ja) ビデオ符号化方法
WO2006118384A1 (en) Method and apparatus for encoding/decoding multi-layer video using weighted prediction
WO2006046550A1 (ja) 画像符号化方法および装置、ならびに画像復号方法および装置
JP2006501750A (ja) ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム
JP2005524354A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を行うウェーブレット・ベース符号化
JP2006502677A (ja) 無制約及びリフティング型動き補償時間フィルタ処理のための効率的動きベクトル予測
Akbari et al. Disparity compensated view filtering wavelet based multiview image code using lagrangian optimization
WO2006080665A1 (en) Video coding method and apparatus
Bourge et al. Low-resolution optimized 3 D-subband scalable codec
WO2006043754A1 (en) Video coding method and apparatus supporting temporal scalability

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20061205