JP2008507170A - ビデオ画像配列の符号化方法および装置 - Google Patents
ビデオ画像配列の符号化方法および装置 Download PDFInfo
- Publication number
- JP2008507170A JP2008507170A JP2007520853A JP2007520853A JP2008507170A JP 2008507170 A JP2008507170 A JP 2008507170A JP 2007520853 A JP2007520853 A JP 2007520853A JP 2007520853 A JP2007520853 A JP 2007520853A JP 2008507170 A JP2008507170 A JP 2008507170A
- Authority
- JP
- Japan
- Prior art keywords
- image
- pixel
- group
- sub
- images
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 57
- 230000033001 locomotion Effects 0.000 claims abstract description 146
- 238000001914 filtration Methods 0.000 claims abstract description 94
- 230000002123 temporal effect Effects 0.000 claims abstract description 92
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 68
- 238000005070 sampling Methods 0.000 claims abstract description 16
- 230000010354 integration Effects 0.000 claims description 22
- 238000004590 computer program Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 description 28
- 238000000280 densification Methods 0.000 description 19
- 238000004891 communication Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 10
- 238000009825 accumulation Methods 0.000 description 6
- 230000002441 reversible effect Effects 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 4
- 230000005540 biological transmission Effects 0.000 description 4
- 230000003595 spectral effect Effects 0.000 description 4
- 239000013598 vector Substances 0.000 description 4
- 239000000783 alginic acid Substances 0.000 description 3
- 235000010443 alginic acid Nutrition 0.000 description 3
- 239000000728 ammonium alginate Substances 0.000 description 3
- 235000010407 ammonium alginate Nutrition 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 239000000770 propane-1,2-diol alginate Substances 0.000 description 3
- 235000010409 propane-1,2-diol alginate Nutrition 0.000 description 3
- 239000000661 sodium alginate Substances 0.000 description 3
- 235000010413 sodium alginate Nutrition 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 239000001904 Arabinogalactan Substances 0.000 description 2
- 239000001878 Bakers yeast glycan Substances 0.000 description 2
- 239000008272 agar Substances 0.000 description 2
- 235000010419 agar Nutrition 0.000 description 2
- 238000003491 array Methods 0.000 description 2
- 239000000648 calcium alginate Substances 0.000 description 2
- 235000010410 calcium alginate Nutrition 0.000 description 2
- 239000000679 carrageenan Substances 0.000 description 2
- 235000010418 carrageenan Nutrition 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 101001013832 Homo sapiens Mitochondrial peptide methionine sulfoxide reductase Proteins 0.000 description 1
- 102100031767 Mitochondrial peptide methionine sulfoxide reductase Human genes 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000001010 compromised effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 239000000737 potassium alginate Substances 0.000 description 1
- 235000010408 potassium alginate Nutrition 0.000 description 1
- 238000003786 synthesis reaction Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/615—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/13—Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Abstract
【課題】復号器で再構築した画像が、アーチファクトを有しないようにする。
【解決手段】本発明は、離散ウェーブレット分解(110)を利用した動き補償された時間フィルタリングによって、ビデオ画像配列を符号化する方法と装置に関する。この離散ウェーブレット分解は、ビデオ画像配列を2つの画像の群に分割することと、ソース群と呼ばれる各画像の各群で、その中の一つの群内の画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する(111,112,113,114)ことを含んでいる。そして、前記ソース群内の少なくとも一つの画像をアップサンプリング(110,111)することで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素を、前記表現する画像が構成している。本発明は、それに関連付けられた復号化方法と復号器にも関係する。
【選択図】図2
【解決手段】本発明は、離散ウェーブレット分解(110)を利用した動き補償された時間フィルタリングによって、ビデオ画像配列を符号化する方法と装置に関する。この離散ウェーブレット分解は、ビデオ画像配列を2つの画像の群に分割することと、ソース群と呼ばれる各画像の各群で、その中の一つの群内の画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する(111,112,113,114)ことを含んでいる。そして、前記ソース群内の少なくとも一つの画像をアップサンプリング(110,111)することで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素を、前記表現する画像が構成している。本発明は、それに関連付けられた復号化方法と復号器にも関係する。
【選択図】図2
Description
本発明は、離散ウェーブレット分解(discrete wavelet decomposition)を利用する動き補償(motion compensation)された時間的フィルタリング(temporal filtering)によって、ビデオ画像配列(シーケンス:sequence)を符号化および復号化する方法や装置に関する。
より正確には、本発明は、離散ウェーブレット変換による動き補償と時間的変換を利用して、デジタル画像シーケンスを符号化する分野に関連する。
デジタル画像配列を符号化するのに用いる大多数の符号器は、完全に符号化されたビデオ画像配列に対応する単一のデータストリームを生成する。クライアントが符号化されたデジタル画像配列を利用したい場合には、完全に符号化されたビデオ画像配列を受取って、これを処理しなければならない。
しかし、インターネットのような通信ネットワークでは、クライアントが様々な特性を有している。こうした特性は、例えば、通信ネットワークにおける各クライアントに独自に割り当てられたバンド幅および/またはクライアント通信端末の処理能力などである。更にクライアントは、その後で、最適な品質と解像度でビデオ画像配列を表示するつもりであったとしても、最初に低い解像度および/または低い品質で、素早くビデオ画像配列を表示しようとする場合がある。
こうした問題を軽減するために、いわゆる拡大縮小可能(スケーラブル:scalable)な、すなわち可変可能な品質および/または時空間的(spatio-temporal)解像度を有するビデオ画像配列の符号化アルゴリズムが出現しており、そのデータストリームは幾つかのレイヤ(層)に符号化され、各レイヤのそれぞれが、より高いレベルのレイヤにネストされる。例えば、より低い品質および/または解像度で符号化されたビデオ画像配列からなるデータストリームの一部を、その特性が制約されたクライアントに伝送し、品質および/または解像度の点に関し、保管したデータからなるデータストリームの別な部分を、その特性が高いクライアントだけに伝送して、ビデオ画像配列を別々に符号化する必要をなくしている。
より最近では、離散ウェーブレット分解(英語では「離散ウェーブレット変換:DWT」)を利用する動き補償された時間的フィルタリングを用いたアルゴリズムが出現している。これらのアルゴリズムでは、まず初めに、ビデオ画像配列中の画像の間でウェーブレット時間的変換を実行し、次に、得られた時間的サブバンドを空間的に分解する。より正確に言えば、ビデオ画像配列は2つの群の画像、つまり偶数番の画像と奇数番の画像、に分解され、各偶数番の画像とこれに最も近い奇数番の画像との間、つまりウェーブレット時間的変換の間に使用される画像の間の動き場(motion field:モーションフィールド)が予測される。これらの偶数番の画像と奇数番の画像は、時間的サブバンドを得るために、相対的な動きが反復的に補償される。これらの各群の構築と動き補償との反復は、異なるウェーブレット変換レベルを生成するために行われてもよい。この時間的画像は、続いて、ウェーブレット解析フィルタを用いて空間的にフィルタ処理される。
この分解が終わった時に、結果は一連の時空間サブバンドとなる。この動き場と時空間サブバンドとは最終的に符号化され、目標とされた解像度レベルに対応したレイヤに送信される。これらのアルゴリズムの幾つかは、ダブリュ スウェールデンス(W Sweldens)氏,サイアン ジェイ アナル(Siam J Anal.)氏による、第29巻,第2号,p511〜546の刊行物に提示され、英語の用語では「リフティング:Lifting」によって知られた技術に基づく空間的フィルタリングを実行する。
これらのアルゴリズムの間で、「バーベルリフティング(Barbell Lifting)を利用した3Dサブバンドビデオコーディング; エムエスアールエイ アジア(MSRA ASIA); Mpeg−21 スケーラブル符号化(SVC)の提案募集(CFP)にS05を寄与」という題名の刊行物には、偶数番の各画像から奇数番の各画像を予測する間に利用される奇数番の各画素(ピクセル)の重み付けを用いて、奇数番の各画像からの画素を備えた偶数番の各画像における画素を更新することが提案されている。奇数番画像の点Q’(x’,y’)を予測するのに、重みWで分担する偶数番画像の点P(x,y)が、重みwの重み付けされた点Q’(x’,y’)の分担で更新されるであろう。
しかし、この解決法は満足なものではない。その理由は、当該アルゴリズムによって幾つかの問題が解決されないことにある。ここでは、更新されない偶数番画像の画素が存在する。こうした更新されない画素は、「ホール」として引用されるが、動き場の更新を完全に元に戻せないものとし、クライアントの復号器で画像を再構築する時にアーチファクト(artifact:人為的歪み)を生じる。加えて、或る偶数番画像における複数の画素によって更新された一定の画素に対し、更新が正規化されなくなる。この正規化の欠如も、クライアントの復号器で画像を再構築する時のプリエコー(pre-echo)および/またはポストエコー(post-echo)のように、アーチファクト(artifact)を生じる。
本発明の目的は、復号器で再構築した画像が、従来技術におけるアーチファクトを有しないような、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を符号化および復号化する方法や装置を提案することで、従来技術の上記欠点を解決することにある。
この目的を達成するために、本発明の第1の態様によれば、本発明は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を符号化する方法を提案しており、ここでは離散ウェーブレット分解が、前記ビデオ画像配列を2つの画像の群に分割するステップと、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する少なくとも一つのステップと、を備えたものにおいて、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素を、前記表現する画像が構成する。
これに対応して、本発明は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を符号化する装置に関係し、前記装置は離散ウェーブレット分解手段を備え、前記離散ウェーブレット分解手段は、前記ビデオ画像配列を2つの画像の群に分割する手段と、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する手段と、を備えたものにおいて、前記符号化する装置は前記表現する画像の形成手段を有し、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素で、前記表現する画像が構成される。
これにより、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列の符号化が可能になるが、その符号化は、サブ画素レベルで動き予測が可能になり、仮に動きが縮小または拡大した場合でも、情報の損失や、解像度を変更したことによる「エイリアシング」現象の導入を避けることができる。
本発明の別な態様によれば、少なくとも一つのウェーブレット分解統合を行なうことで、前記ソース群内の前記画像がアップサンプルされる
これにより、空間的なサブ解像度で符号化が行われる場合に、ウェーブレット統合がアップサンプリングに特に良く適合し、ウェーブレット分解の逆をなすことになる。
これにより、空間的なサブ解像度で符号化が行われる場合に、ウェーブレット統合がアップサンプリングに特に良く適合し、ウェーブレット分解の逆をなすことになる。
本発明の別な態様によれば、前記送り先群内の画像と、前記画像を決定するのに用いた前記画像ソース群内のそれぞれの画像との間で動き場が決定され、また前記決定した動き場から、前記画像を予測するのに用いた前記ソース群内のそれぞれの画像における少なくとも一つの画素および/またはサブ画素が、前記送り先群内の画像を表現する画像の各画素および各サブ画素と関連付けられる。
これにより、動き場は完全に可逆可能となり、従来技術におけるホールが、ビデオ画像配列の復号化中に、アーチファクトを生成しやすくすることに関連する問題を、なくすことができる。
本発明の別な態様によれば、前記送り先群内の画像を表現する画像の各画素および各サブ画素の値は、前記送り先群内の画像を表現する画像の前記画素およびサブ画素と関連付けられた各画素およびサブ画素の値を合計すると共に、その合計を、前記送り先群内の画像を表現する画像の前記画素または前記サブ画素と関連付けられた各画素および各サブ画素の数で割ることで取得される。
これにより、ビデオ画像配列を復号化するときのプリエコーおよび/またはポストエコーのようなアーチファクトが、大幅に減少する。
本発明の別な態様によれば、前記送り先群内の画像を表現する画像が、ローパスフィルタによってフィルタ処理される。
これにより縮小する動きに対する問題が減少する。
本発明の別な態様によれば、各画像の前記送り先群内の画像と同じ解像度で、サブサンプルされた画像を取得するために、このサブサンプルされた画像が表わす各画像の前記送り先群内の画像を表現する画像が、少なくとも一つの離散ウェーブレット分解を利用してサブサンプルされる。
本発明は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を復号化する方法にも関係し、これは離散ウェーブレット分解が、前記ビデオ画像配列を2つの画像の群に分割するステップと、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する少なくとも一つのステップと、を含むものにおいて、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素を、前記表現する画像が構成するものである。
これに対応して、本発明は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を復号化する装置に関係し、前記装置は離散ウェーブレット分解手段を備え、前記離散ウェーブレット分解手段は、前記ビデオ画像配列を2つの画像の群に分割する手段と、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する手段と、を備えたものにおいて、前記復号化する装置は前記表現する画像の形成手段を有し、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素で、前記表現する画像が構成される。
本発明は、ビデオ画像配列を含む信号にも関係し、このビデオ画像配列は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって符号化され、前記信号は高周波数および低周波数の各画像を含み、これらの各画像は、前記ビデオ画像配列を2つの画像の群に分割すると共に、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定することで取得されるものにおいて、前記高周波数および低周波数の各画像は、各画素および各サブ画素から取得され、この各画素および各サブ画素は、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで取得した各画素と各サブ画素から決定される。
本発明は、ビデオ画像配列を含む信号を送信する方法にも関係し、このビデオ画像配列は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって符号化されたものにおいて、前記信号は高周波数および低周波数の各画像を含み、これらの各画像は、前記ビデオ画像配列を2つの画像の群に分割すると共に、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定することで取得され、またこの高周波数および低周波数の各画像は、各画素および各サブ画素から取得され、この各画素および各サブ画素は、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで取得した各画素と各サブ画素から決定される。
本発明は、デオ画像配列を含む信号を蓄積する方法にも関係し、このビデオ画像配列は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって符号化されたものにおいて、前記信号は高周波数および低周波数の各画像を含み、これらの各画像は、前記ビデオ画像配列を2つの画像の群に分割すると共に、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定することで取得され、またこの高周波数および低周波数の各画像は、各画素および各サブ画素から取得され、この各画素および各サブ画素は、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで取得した各画素と各サブ画素から決定される。
前記方法,復号化装置,送信および/または蓄積手段に蓄積されたビデオ画像配列を含む信号の利点は、前記符号化方法や符号化装置の利点と同じであるので、ここでは繰り返さない。
本発明は、情報媒体に蓄積されるコンピュータプログラムにも関係し、このプログラムは、当該プログラムがコンピュータシステムにロードされ、このコンピュータシステムにより実行されると、上述した方法を行なう指令を含んでいる。
上述した本発明の特徴は、他の特徴と同様に、実施例の記述を理解することでより明確になろうが、前記記述は、添付の各図面と関連して説明されるであろう。
図1は、動き補償された時間フィルタリングを備えたビデオコーダーのブロック図を示している。
動き補償された時間的フィルタリングを有するビデオコーダー10は、ビデオ画像配列(シーケンス)15をスケーラブルデータストリーム18に符号化することができる。スケーラブルデータストリーム18は、その中のデータが、画像の解像度および/または品質について、データを受け取るアプリケーションの種類に応じて可変できる表示を送信できるように配列されている流れ(stream)である。このスケーラブルデータストリームに含まれるデータは、ビデオ画像配列の各種符号化を行なう必要なく、品質及び解像度の双方の点で、拡大縮小可能な手法すなわち英語では「スケーラブル(scalable)」な手法で、ビデオ画像配列の送信を保証するように符号化される。従って、通信ネットワークの伝送速度が低いとき、および/または通信端末が高品質および/または高解像度を必要としないときに、スケーラブルデータストリーム18の一部のみをデータ媒体に蓄積し、および/または通信端末へ送信することが可能となる。また、通信ネットワークの伝送速度が高いとき、および通信端末が高品質および/または高解像度を要求するときに、これと同一のスケーラブルデータストリーム18を用いて、スケーラブルデータストリーム18の全てをあらゆるデータ媒体に蓄積し、および/または通信端末へ送信することが可能となる。
本発明によれば、動き補償された時間的フィルタリングを有するビデオコーダー10は、動き補償された時間フィルタリングモジュール(MCTF)100を含む。この動き補償された時間フィルタリングモジュール100は、N個の画像からなる一つの群を、例えば(N+1)/2個の低周波数画像からなる一つの群と、N/2個の高周波数画像からなる一つの群のように、各画像からなる二つの群に変換し、動き補償された時間フィルタリングを備えたビデオコーダー10における動き予測モジュール11で行われる動き予測を用いて、これらの画像を変換する。動き予測モジュール11は、画像配列の中で、x2[m,n]で示されるそれぞれの偶数番画像と、それに先行する奇数番画像x1[m,n](更に場合によっては、後続する画像ペアの奇数番画像を伴なう)との間で、動き予測を実行する。動き補償された時間フィルタリングモジュール100は、その時間フィルタリングが可能な限り効果的になるように、偶数番画像x2[m,n]の動きを補償する。これは、予測画像と画像との間の差が小さければより効果的に、すなわち良好な比率/歪みで妥協して、或いは等価的には再構築の品質に対し良好な比率の圧縮率で圧縮される。
動き予測モジュール11は、各々の偶数番と奇数番の画像ペアについて、例えば偶数番画像に対する奇数番画像のブロックを整合(matching)させることにより(これに限定されない)、動き場を計算する。これは、「ブロックマッチング:block matching」という英語の用語で知られている。もちろん、例えばメッシュ法(meshing)による動き予測手法等の他の手法を用いてもよい。そのため、偶数番ソース画像(画像源)の一定の画素におけるマッチングが、奇数番画像の各画素と共に行われる。特に、ブロックによる予測を行なう場合には、ブロックの動き値を奇数番画像のブロックの各画素と各サブ画素に割り当てることができる。ある変形例においては、ブロックの重み付けされた動きベクトルと、この隣の各ブロックの重み付けされた動きベクトルが、OBMC(Overlapped Block Motion Compensation)という名で知られた手法によって、ブロックの各画素に割り当てられる。
動き補償された時間フィルタリングモジュール100は、各画像の離散ウェーブレット分解を実行して、ビデオ画像配列を、一乃至複数の解像度レベルにわたって割り当てられた幾つかの時間的サブバンドに分解する。この離散ウェーブレット分解は、要求された分解レベルに到達していない限り、時間的サブバンドの低周波数サブバンドに再帰的に適用される。動き補償された時間的フィルタリングを有するビデオコーダー10の判定モジュール12は、要求された分解レベルに達しているか否かを判定する。
動き補償された時間フィルタリングモジュール100によって取得した各種周波数サブバンドは、スケーラブルデータストリーム生成モジュール13に転送される。動き予測モジュール11は、スケーラブルストリーム生成モジュール13に動き予測を転送し、そこで各種周波数サブバンドと動き予測から、スケーラブルデータストリームを生成する。
図2は、ハール(Haar)フィルタをウェーブレット分解に用いた場合に、図1におけるビデオコーダーの動き補償された時間的フィルタリングモジュールのブロック図を示している。動き補償された時間フィルタリングモジュール100は、「リフティング」という用語で知られた手法に基づいて、時間的フィルタリングを実行する。この手法は、ウェーブレットフィルタリングと同等に、簡単で、柔軟性があり、しかも可逆(元の状態に戻せる)なフィルタリングを行なわせることが可能である。
ソースの偶数番画像x2[m,n]は、統合モジュール110で本発明に基づく離散ウェーブレット変換統合すなわちSDWTを行なうことで、アップサンプル(upsample)される。その理由は、補間に代わり離散ウェーブレット変換統合(synthesis)を用いることで、とりわけ離散ウェーブレット分解により画像x2[m,n]を取得した場合に、予測の違いが大幅に減少するからである。
各モジュール100〜16からなる動き補償された時間フィルタリングモジュール100の部分に対しての画像ソースは、偶数番画像x2[m,n]となる。
アップサンプルされた偶数番画像x2[m,n]は、補間モジュール111によって再度アップサンプルされる。この補間モジュール111は、例えば4分の1の画素の解像度を有する画像を取得できるように補間を行なう。ここでの補間は、例えば現時点で処理されるべき画素に最も近接した各画素が、各係数によって重み付けされるバイリニア(bilinear:双一次)補間であり、前記係数の合計は1に等しく、またこの係数は、現時点で処理されるべき画素から各画素の距離に対してリニアに減少する。変形例として、この補間はバイキュービック(bicubic:双三次)補間や、カーディナルサイン(cardinal sine)補間である。したがって、x2[m,n]で示された画像は、統合モジュール110および補間モジュール111によって、例えば4分の1の画素解像度を有する画像x’2[m’,n’]に変換される。
動き補償された時間フィルタリングモジュール100は更に、初期モーション連結モジュール121を備えている。初期モーション連結モジュール121は、送信先(destination)画像x1[m,n]の少なくとも4倍以上の画素を備えた画像x’1[m'’,n'']を形成する。この画像x’1[m'’,n'']は、x1[m,n]の補間によって、或いは他のあらゆる方法や協調によって、画像x’1[m'’,n'']の各画素および各サブ画素(例えば、これらの各画素および各サブ画素からなり、初期モーション連結モジュール121によって予測されたブロックの動きベクトル)と共に形成される。前記送り先画像は、各モジュール100〜116からなる動き補償された時間フィルタリングモジュール100の部分に対して、奇数番画像x1[m,n]である。
画像x’2[m’,n’]の画素は、ここでは画像x2[m,n]の画素と同じ位置を有する画像x’2[m’,n’]の画素を意味する。画像x’2[m’,n’]のサブ画素は、ここでは離散ウェーブレット変換統合および/または補間によって生成された画像x’2[m’,n’]の画素を意味する。画像x’1[m'’,n'']の画素は、ここでは画像x1[m,n]の画素と同じ位置を有する画像x’1[m’,n’]の画素を意味する。画像x’1[m'’,n'']のサブ画素は、ここでは離散ウェーブレット変換統合および/または補間によって生成された画像x’1[m'’,n'']の画素を意味する。
動き補償された時間フィルタリングモジュール100は、動き場緻密化モジュール112を備えている。この動き場緻密化モジュール112は、初期モーション連結モジュール121によって構築された関係を用いて、ソース画像x’2[m’,n’]の少なくとも一つの画素と、送り先画像x’1[m'’,n'']の各画素および各サブ画素とを関連付ける。
この関連付けが全て行われると、蓄積(accumulation)モジュール113は、そのサイズが画像x’1[m'’,n'']のサイズである蓄積画像xa’[m'’,n'']を生成する。当該蓄積画像Xa’[m'’,n'']における各々の画素およびサブ画素の値は、送り先画像x’1[m'’,n'']の対応する画素若しくはサブ画素と関連付けられたソース画像x’2[m’,n’]の各画素および各サブピクセルの値を合計したものに等しく、この合計は標準化(normalized)され、より詳しくは、画像x’1[m'’,n'']の対応する画素若しくはサブ画素と関連付けられたソース画像x’2[m’,n’]の各画素および各サブピクセルの数で割り算される。この除算は、画像シーケンスを復号する間に発生し、プリエコーおよび/またはポストエコー効果のようなアーチファクトを回避させることができる。
本発明の変形例において、Wconnexで示される重みは、前記関連付けのそれぞれに割り当てられる。画像Xa’[m’,n']の各画素またはサブ画素に対する更新値は、次の数式に基づき計算されるであろう。
ここで、Majは画像Xa’[m'’,n'']の画素またはサブ画素の値であり、Valsrcは、送り先画像x’1[m'’,n'']の画素若しくはサブ画素と関連付けられたソース画像x2[m,n]の画素の値である。
画像Xa’[m'’,n'']は、その後に符号114で示されるローパスフィルタでフィルタ処理される。ローパスフィルタ114の機能は、画像Xa’[m'’,n'']中の一定の高周波成分を低減させることにあり、これによりユニット115により行われる画像のサブサンプリング(subsampling:副標本)中に、スペクトルのエイリアシングに関係するあらゆるアーチファクトを避けることができる。
画像Xa’[m'’,n'']における全ての画素とサブ画素にローパスフィルタ処理を行なうことで、画像Xa’[m'’,n'']の幾つかの細部が維持される。
フィルタ処理された画像Xa’[m'’,n'']は、その後でモジュール(ADWT)115によりサブサンプルされる。このモジュール115は、画像Xa’[m'’,n'']をサブサンプルする第1のサブサンプル器および離散ウェーブレット分解モジュールを備え、これにより画像Xa’[m'’,n'']は、画像x1[m,n]と同じ解像度を有する。サブサンプルされた画像Xa’[m'’,n'']は、その後でH[m,n]で示される高周波成分を含んだ画像を形成するために、減算器116によって画像x1[m,n]から減算される。この画像H[m,n]は、その後にスケーラブルデータストリーム生成モジュール13と統合モジュール130に転送される。
各モジュール130〜136からなる動き補償された時間フィルタリングモジュール100の部分に対してのソース画像は、その画像H[m,n]となる。
ソース画像H[m,n]は、統合モジュール130で本発明に基づく離散ウェーブレット変換統合すなわちSDWTを行なうことで、アップサンプルされる。
アップサンプルされたソース画像H[m,n]は、ソース画像H’[m’,n’]を取得するために、補間モジュール131によって再度アップサンプルされる。この補間モジュール131は、例えば4分の1の画素の解像度を有する画像を取得できるように補間を行なう。ここでの補間は、例えば前記補間モジュール111で行なわれるものと同一の補間である。動き補償された時間フィルタリングモジュール100は、更に動き場緻密化モジュール132を備えている。
動き場緻密化モジュール132は、ソース画像H’[m’,n’]と送り先画像x’2[m'’,n'']との間の関係を当てはめるために、初期モーション連結モジュールによって生成されたx’1[m'’,n'']とx’2[m'’,n'']との初期的な関係を逆転させる。各モジュール130〜136からなる動き補償された時間フィルタリングモジュール100の部分に対しての送り先画像は、画像x2[m,n]または画像x’2[m'’,n'']である。
動き場緻密化モジュール132は、初期モーション連結モジュール121によって構築された関係から、ソース画像H’[m’,n’]の少なくとも一つの画素と、送り先画像x’2[m'’,n'']の各画素および各サブ画素とを関連付ける。
ここで、送り先画像x’2[m'’,n'']の画素および/またはサブ画素の幾つかは、ソース画像H’[m’,n’]の画素またはサブ画素と関連付けられていないことに注目すべきである。これらの画素またはサブ画素は、画像をクライアントの復号器で再構築した時に、動き場を完全に元の状態に戻せないものとし、アーチファクトを生じさせる。一方、動き場緻密化モジュール132は、本発明に基づくものであって、これはこうした「ホール」に対する関連付けを構築する。そのために、動き場緻密化モジュール132は、送り先画像x’2[m'’,n'']における全ての画素よびサブ画素が、それに関連付けられたソース画像H’[m’,n’]の少なくとも一つの画素よびサブ画素を有していない限り、送り先画像x’2[m'’,n'']の各画素およびサブ画素と、最も近くに隣接する画素またはサブ画素と関連付けられた画像ソースH’[m’,n’]の画素とを、繰り返しそして徐々に伝達することで関連付ける。とりわけ本実施形態では、送り先画像x’2[m'’,n'']の画素またはサブ画素が、例えば4つの画素のように、画像ソースH’[m’,n’]の予め設定された画素数で関連付けられ、その画素に対して新たな関連付けがなされないことに注目すべきである。
この関連付けが全て行われると、蓄積(accumulation)モジュール133は、蓄積画像Xb’[m'’,n'']を生成する。蓄積画像Xb’[m'’,n'']は、送り先画像x’2[m'’,n'']と同じサイズであり、またその各画素および各サブ画素のそれぞれの値は、画像x’2[m'’,n'']の対応する画素若しくはサブ画素と関連付けられたソース画像H’[m’,n’]の各画素および各サブピクセルの値を合計したものに等しい。この合計は、ソース画像H’[m’,n’]の対応する画素若しくはサブ画素と関連付けられたソース画像x’2[m'’,n'']の各画素および各サブピクセルの数で割り算される。この除算は、画像シーケンスを復号する間に発生し、プリエコーおよび/またはポストエコー効果のようなアーチファクトを回避させることができる。
本発明の変形例において、Wconnexで示される重みは、前記関連付けのそれぞれに割り当てられる。画像Xb’[m'’,n'']の各画素またはサブ画素に対する更新値は、次の数式に基づき計算されるであろう。
ここで、Majは画像Xb’[m'’,n'']の画素またはサブ画素の値であり、Valsrcは、送り先画像x’2[m'’,n'']の画素若しくはサブ画素と関連付けられたソース画像H’[m’,n’]の画素の値である。
画像Xb’[m'’,n'']は、その後に符号134で示されるローパスフィルタでフィルタ処理される。ローパスフィルタ134の機能は、画像Xb’[m'’,n'']中の一定の高周波成分を低減させることにあり、これによりユニット115により行われる画像のサブサンプリング中に、スペクトルのエイリアシングに関係するあらゆるアーチファクトを避けることができる。画像Xb’[m'’,n'']における全ての画素とサブ画素にローパスフィルタ処理を行なうことで、画像Xb’[m'’,n'']の幾つかの細部が維持される。
フィルタ処理された画像Xb’[m'’,n'']は、その後でモジュール135によりサブサンプルされる。このモジュール135は、画像Xb’[m'’,n'']をサブサンプルする第1のサブサンプル器および離散ウェーブレット分解モジュールを備え、これにより画像Xb’[m'’,n'']は、画像x2[m,n]と同じ解像度を有する。サブサンプルされた画像Xb’[m'’,n'']は、その後でL[m,n]で示される低周波成分を含んだ画像を形成するために、加算器136によって画像x2[m,n]に半加算される。この画像L[m,n]は、その後にスケーラブルデータストリーム生成モジュール13に転送される。
その後に画像L[m,n]は、新たな分解のための動き補償された時間フィルタリングモジュール100により、必要な解像度が取得若しくは再生されると、動き補償された時間的フィルタリングを有するビデオコーダー10の判定モジュール12に転送される。新たな分解を行なう必要がある場合、上述したのと同じ手法で、画像L[m,n]が動き補償された時間フィルタリングモジュール100により処理される。
したがって、動き補償された時間フィルタリングモジュール100は、例えばハールフィルタを用いた場合に、次の形態の高周波および低周波の各画像を形成する。
ここで、Wi→jは、画像jに画像iを動き補償することを示す。
図3は、図4および図8に説明されたアルゴリズムに従って、符号化および復号化のアルゴリズムを実行可能な計算および/または通信装置(computing and/or telecommunication device)のブロック図を示している。
この計算および/または通信装置30は、ソフトウェアを用いて、動き補償された時間的フィルタリングを画像配列に実行するのに適合される。更に装置30は、ソフトウェアを用いて、逆の動き補償された時間的フィルタリングを本発明に基づく符号化された画像配列に実行することも可能である。
前記装置30は、例えばマイクロコンピュータである。また、前記装置をビデオ画像配列表示手段に組み込んでもよく、この手段はテレビや、テレビ,携帯電話などの受信端末用に意図された一連の情報を生成する他のあらゆる装置とすることができる。
前記装置30は通信バス301を備え、この通信バス301は、中央処理装置(CPU)300と、リードオンリィメモリ(ROM)302と、ランダムアクセスメモリ(RAM)303と、スクリーン304と、キーボード305と、ハードディスク(HD)308と、デジタルビデオディスク再生装置/録音装置としてのDVD309と、通信ネットワークとの電気通信インターフェイス(I/O)306と、に接続される。
ハードディスク308は、本発明を実行するプログラムのみならず、本発明に基づく符号化および/または復号化を可能にするデータを記憶する。
より一般的に言えば、本発明のプログラムは記憶手段に記憶される。この記憶手段は、コンピュータすなわちマイクロコンピュータ300によって読み出し可能である。この記憶手段は前記装置に組み込まれていてもよく、組み込まれていなくてもよく、また取り外し可能であってもよい。
前記装置30が起動すると、本発明による前記プログラムは、本発明の実行コードのみならず本発明の実行に必要なデータを含んだランダムアクセスメモリ303に送信される。
通信インターフェイス306は、本発明に基づく復号化のために、符号化されたスケーラブルデータのストリームを受け取ることを可能にする。更に通信インターフェイス306は、本発明に基づく符号化されたスケーラブルデータを、電気通信ネットワーク上に転送することを可能にする。
図4は、動き補償された時間フィルタリングがソフトウェアから実行され、そのソフトウェアのハールフィルタがウェーブレット分解に用いられた時に、処理装置により実行される符号化アルゴリズムを示している。
前記符号化および/または復号化を行なう装置30の処理装置300は、用語「リフティング(lifting)」で知られた技術に従って、時間的フィルタリングを行なう。
ステップE400では、本発明に基づいて離散ウェーブレット変換統合を行なうことによって、処理装置300でソース画像がアップサンプルされる。本アルゴリズムにおけるここでの説明に対するソース画像は、偶数番画像x2[m,n]である。
ステップE401において、アップサンプルされたソース画像x2[m,n]が、補間を行なうことで再度アップサンプルされる。この補間は、例えばバイリニア補間,バイキュービック補間,またはカーディナルサイン補間である。これにより画像x2[m,n]は、例えば4分の1の画素解像度を有する画像x’2[m’,n’]に変換される。
ステップE402において、偶数番画像x2[m,n]と現在処理されている送り先画像x1[m,n]との間で、動き予測が既になされているか否かをチェックする。ここでの送り先画像は、奇数番画像x1[m,n]である。
ここで、もし動き予測が既になされていれば、処理装置300は装置30のRAMメモリ303に記憶された動き予測を読み込み、ステップE405に移動する。もし動き予測がなされていなければ、ステップE403に移動する。
ステップE403では、例えばソース画像および送り先画像の各ブロックを整合させることにより(これに限定されない)、動き場を計算する。もちろん、例えばメッシュ法による動き予測手法等の他の手法を用いてもよい。
この動作が一度行われると、処理装置300は次のステップE404に移動し、ステップE403で取得した初期モーション(動き)の関係を構築する。処理装置300は、送り先画像がアップサンプルされた時に、その送り先画像x1[m,n]の各画素、若しくは送り先画像x’1[m'’,n'']の各サブ画素と、例えばこれらの各画素からなるブロックの動きベクトルを関連付ける。
その後のステップE405で、処理装置300はその関係の緻密化を実行する。ここでの緻密化は、前記動き場緻密化モジュール112で行なったのと同じ手法で実行される。
こうした動作が一度行われると、処理装置300はステップE406において、前記蓄積モジュール113で行なったのと同じ手法で、蓄積画像xa’[m'’,n'']を生成する。
画像Xa’[m'’,n'']はその後のステップE407において、画像Xa’[m'’,n'']中の一定の高周波成分を低減させ、且つ後に続く画像のサブサンプリング中に、スペクトルのエイリアシングに関係するあらゆるアーチファクトを避けるために、ローパスフィルタリングを行なうことでフィルタ処理される。
フィルタ処理された画像Xa’[m'’,n'']は、その後のステップE408で、当該画像Xa’[m'’,n'']のサブサンプルと離散ウェーブレット分解を行なうことによって、画像x1[m,n]と同じ解像を有するようにサブサンプルされる。サブサンプルされた画像Xa’[m'’,n'']は、その後のステップE409で、H[m,n]で示される高周波成分を有する画像を形成するために、画像x1[m,n]から減算される。この画像H[m,n]は、その後にスケーラブルデータストリーム生成モジュール13に転送される。
処理装置300は、ソース画像として画像H[m,n]を取り込み、送り先画像として画像x2[m,n]を取り込んで、再度ステップE400〜E409の各手順を実行する。
処理装置は、ステップE400とステップE401において、画像x2[m,n]で行なったのと同じ動作を画像H[m,n]に行なう。これについては更に説明しない。
ステップE405で、処理装置300は前述した動き場緻密化モジュール132で行なったのと同じ手法で、関係の緻密化を行なう。
この関連付けが全て行われると、処理装置300はステップE406において、前記蓄積モジュール133で説明したのと同じ手法で、蓄積画像xb’[m'’,n'']を生成する。
ステップE407およびステップE408で、処理装置300は、蓄積画像xa’[m'’,n'']で行なったのと同じ動作を蓄積画像xb’[m'’,n'']に行なうが、これについては更に説明しない。
こうした動作が行われると、低周波数成分の画像L[m,n]を形成するために、フィルタ処理とサブサンプルがなされた画像xb’[m'’,n'']の半分を、画像x2[m,n]に加算する。
その後に画像L[m,n]は、新たな分解のための現アルゴリズムによって、必要な解像度が取得若しくは再生されると、動き補償された時間的フィルタリングを有するビデオコーダー10の判定モジュール12に転送される。新たな分解を行なうべき時に、上述したのと同じ手法で、画像L[m,n]が処理される。
図5は、本発明による動き補償された時間フィルタリングを備えたビデオデコーダーのブロック図を示す。
動き補償された時間フィルタリングを有するビデオデコーダー60は、スケーラブルデータストリーム18をビデオ画像配列65に復号化することができるが、このスケーラブルデータストリーム18に含まれるデータは、図1に示したコーダーによって符号化されている。
動き補償された時間フィルタリングを有するビデオデコーダー60は、データストリーム18を解析するためのモジュール68を備えている。解析モジュール68はデータストリーム18を解析し、最低の分解レベルの低周波数成分を含む画像だけでなく、各々の分解レベルにおける各高周波画像を、そのデータストリーム18から抽出する。解析モジュール68は、高周波の各成分66と低周波の各成分67からなる各画像を、逆動き補償された時間フィルタリングモジュール(IMCTF)600に転送する。さらに解析モジュール68は、図1の符号器10によって形成された動き場の様々な予測を、データストリーム18から抽出すると共に、その抽出したものを動き場蓄積モジュール61に転送する。
逆動き補償された時間フィルタリングモジュール600は、より高い分解レベルの低周波数画像に対応した偶数番画像と奇数番画像を形成するのに、高周波数画像と低周波数画像を反復して転送する。逆動き補償された時間フィルタリングモジュール600は、モジュール61に蓄積された各動き予測から、ビデオ画像配列を形成する。これらの動き予測は、本発明における符号器10によって符号化され、ビデオ画像シーケンス内における偶数番画像と、その後に続く奇数番画像のそれぞれの間における予測である。
逆動き補償された時間フィルタリングモジュール600は、ビデオ画像配列を形成するために、画像L[m,n]および画像H[m,n]の離散ウェーブレット統合を実行する。この離散ウェーブレット統合は、必要な分解レベルに達しない限り、時間的な各サブバンドの低周波数画像に繰り返し適用される。逆に動き補償された時間フィルタリングモジュール600の判定モジュール62は、必要な分解レベルに達したか否かを判定するものである。
図6は、ハールフィルタがウェーブレット分解に用いられた時に、図5のビデオデコーダーの逆動き補償時間フィルタリングモジュールのブロック図を示している。
逆動き補償された時間フィルタリングモジュール600は、本発明の符号器によって符号化されたビデオ画像から、様々な配列の画像を再構築するために、前記「リフティング」手法に基づく時間的フィルタリングを実行する。
画像H[m,n]すなわちソース画像は、統合モジュール610によってアップサンプルされる。統合モジュール610は、図2における統合モジュール310と同一であるので、更には説明しない。
アップサンプルされた画像H[m,n]は、画像H’[m’,n’]を形成するのに、補間モジュール611によって再度アップサンプルされる。補間モジュール611は、図2における補間モジュール311と同一であるので、更には説明しない。
動き補償された時間フィルタリングモジュール100は、図2における初期モーション連結モジュール121と同一の初期モーション連結モジュール621を備えているが、これは更には説明しない。
逆動き補償された時間フィルタリングモジュール600は、逆動き場緻密化モジュール612を備えている。この逆動き場緻密化モジュール612は、図2における動き場緻密化モジュール132と同一であるので、更には説明しない。
逆動き補償された時間フィルタリングモジュール600は、蓄積モジュール613を備えている。この蓄積モジュール613は、図2における蓄積モジュール113と同一であるので、更には説明しない。蓄積モジュール613は、蓄積画像Xb’[m'’,n'']を生成する。
逆動き補償された時間フィルタリングモジュール600は、フィルタリングモジュール134と離散ウェーブレット分解モジュール135にそれぞれ対応した、フィルタリングモジュール614と離散ウェーブレット分解モジュール615をそれぞれ備えているが、これらは更には説明しない。
逆動き補償された時間フィルタリングモジュール600は、x2[m,n]で示される偶数番画像を形成するために、前記画像H[m,n]からフィルタ処理およびサブサンプルされた画像Xb’[m'’,n'']の半分を減じる加算器616を備えている。
画像x2[m,n]すなわちソース画像は、統合モジュール630によってアップサンプルされる。この統合モジュール630は、図6における統合モジュール610と同一であるので、更には説明しない。
アップサンプルされた画像x2[m,n]は、画像x’2[m’,n’]を形成するのに、補間モジュール631によって再度アップサンプルされる。補間モジュール611は、図2における補間モジュール111と同一であるので、更には説明しない。
逆動き補償された時間フィルタリングモジュール600は、逆動き場緻密化モジュール632を備えている。この逆動き場緻密化モジュール632は、図2における動き場緻密化モジュール112と同一であるので、更には説明しない。
逆動き補償された時間フィルタリングモジュール600は、図2における蓄積モジュール113と同一の蓄積モジュール633を備えているが、これは更には説明しない。蓄積モジュール633は、蓄積画像Xa’[m'’,n'']を生成する。
逆動き補償された時間フィルタリングモジュール600は、フィルタリングモジュール114と離散ウェーブレット分解モジュール115にそれぞれ対応した、フィルタリングモジュール634と離散ウェーブレット分解モジュール635をそれぞれ備えているが、これらは更には説明しない。
逆動き補償された時間フィルタリングモジュール600は、x1[m,n]で示される奇数番画像を形成するために、前記画像H[m,n]にフィルタ処理およびサブサンプルされた画像Xa’[m'’,n'']を加える加算器636を備えている。この奇数番画像は、判定モジュール62に転送される。これらの画像x1[m,n]と画像x2[m,n]を、必要な分解レベルに基づきインターリーブして、逆動き補償された時間フィルタリングモジュール600におけるスケーラブルデータストリーム18に読込まれ、より高いレベルの画像H[m,n]と共に再導入され、さもなければ再導入されない画像L[m,n]を生成する。
図7は、逆動き補償された時間フィルタリングがソフトウェアにより実行され、そのソフトウェアにおけるハールフィルタがウェーブレット分解に用いられた時に、処理装置により実行される復号化アルゴリズムを示している。
符号化および/または復号化装置30の処理装置300は、用語「リフティング(lifting)」で知られた技術に従って、時間的フィルタリングを行なう。
処理装置300は、ソース画像として画像H[m,n]を取り込み、送り先画像として画像L[m,n]を取り込んで、ステップE800〜E807の各手順を実行する。
ステップE800において、ソース画像H[m,n]は、処理装置300による統合モジュールで、本発明に基づく離散ウェーブレット変換統合を行なうことで、アップサンプルされる。
ステップE801において、画像H’[m’,n’]を形成するために、図4におけるステップE401に関連して説明したのと同じ手法で、アップサンプルされたソース画像H[m,n]が、補間を行なうことで再度アップサンプルされる。
ステップE802において、処理装置300は、スケーラブルデータストリーム18の対応する動き場を読込むと共に、初期関係を確かめる。このステップは、図4におけるステップE404と同一であるので、更なる説明はしない。
この動作が一度行われると、処理装置300は次のステップE803を通過して、緻密な関係を構築する。処理装置300は、初期モーション連結モジュール621によって構築された関係を利用して、送り先画像L[m,n]の少なくとも一つの画素を、ソース画像H’[m’,n’]の画素およびサブ画素のそれぞれと関連付ける。前記緻密な関係は、図2における緻密化モジュール132によって行われたものと同じ手法で、ソース画像の画素およびサブ画素と送り先画像の画素およびサブ画素との間で確立される。
この関連付けが全て行われると、処理装置300はステップE804に移動して、蓄積画像xb’[m'’,n'']を生成する。蓄積画像xb’[m'’,n'']は、図2における蓄積モジュール133で説明したのと同じ手法で生成されるので、更には説明しない。
画像Xb’[m'’,n'']はその後のステップE805において、この画像Xb’[m'’,n'']中の一定の高周波成分を低減させ、且つ後に続く画像のサブサンプリング中に、スペクトルのエイリアシングに関係するあらゆるアーチファクトを避けるために、ローパスフィルタリングを行なうことでフィルタ処理される。
フィルタ処理された画像Xb’[m'’,n'']は、その後のステップE806において、画像L[m,n]と同じ解像度を有するように、画像Xb’[m'’,n'']をサブサンプルした後、離散ウェーブレット分解を行なうことで、サブサンプルされる。
サブサンプルされた画像Xb’[m'’,n'']は、x2[m,n]で示される画像を形成するために、画像L[m,n]から半分差し引かれる。
処理装置300は、ソース画像として画像x2[m,n]を取り込み、送り先画像として画像H[m,n]を取り込んで、ステップE800〜E807の各手順を再度実行する。
ステップE800〜E802では、ソース画像H[m,n]に以前行なったものと同じ動作を、処理装置がソース画像x2[m,n]に実行するが、これは更には説明しない。
ステップE803では、前述した動き場緻密化モジュール132によって行なわれたのと同じ手法で、各関係における緻密化が行われる。
この関連付けが全て行われると、処理装置300はステップE804において、蓄積モジュール113で説明したのと同じ手法で蓄積画像xa’[m'’,n'']を生成する。
ステップE805およびステップE806では、蓄積画像x’b[m'’,n'']に行なったものと同じ動作を、処理装置300が蓄積画像x’a[m'’,n'']に実行するが、これは更には説明しない。
こうした動作が行われると、奇数画像x1[m,n]を形成するために、フィルタ処理とサブサンプルがなされた画像x’a[m'’,n'']を、画像H[m,n]に加える。画像x1[m,n]および画像x2[m,n]は、必要な分解レベルに基づき、逆動き補償された時間フィルタリングモジュール600に再導入され、或いは再導入されなくなる。
本発明は、ハールフィルタの使用に関連したものが提示されている。5/3フィルタや9/7フィルタのような他のフィルタであっても、本発明に利用できる。これらのフィルタは、送り先画像を予測するために、ソース画像よりも大きな数を用いる。またこれらのフィルタは、エム ビー アダムス(M B Adams)氏による「埋め込み画像圧縮への可逆ウェーブレット変換とその応用,エムエーエスシー論文(MASC thesis),電気およびコンピュータ工学部,ビクトリアBC大学 1988年」の文書に記述されている。
一般的に、ビデオコーダーの動き補償された時間フィルタリングモジュールにおけるモジュール110〜116は、送り先画像を予測するモジュールである一方で、ビデオコーダーの動き補償された時間フィルタリングモジュールにおけるモジュール130〜136は、送り先画像を更新するモジュールである。また、逆動き補償された時間フィルタリングモジュールにおけるモジュール610〜616は、送り先画像を更新するモジュールである一方で、ビデオコーダーの逆動き補償された時間フィルタリングモジュールにおけるモジュール630〜636は、送り先画像を予測するモジュールである。
本発明で説明したような符号化および復号化の各装置は、ソース画像と送り先画像からなる各ペアに対して、先に提案したのに基づく蓄積画像を形成している。これらの各蓄積画像のそれぞれは、送り先画像の予測および/または更新のために考慮される。
そのため蓄積画像は、その後で送り先画像に加えられ、或いは送り先画像から差し引かれる。
本発明は、本来、前述した実施例に全く限定されるものではなく、むしろ当業者の能力の範囲内に属する如何なる変形も包含するものである。
Claims (19)
- 離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を符号化する方法であって、
離散ウェーブレット分解が、前記ビデオ画像配列を2つの画像の群に分割するステップを含み、
この分割ステップは、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する少なくとも一つのステップを伴なうものにおいて、
前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素を、前記表現する画像が構成することを特徴とする方法。 - 少なくとも一つのウェーブレット分解統合を行なうことで、前記ソース群内の前記画像がアップサンプルされることを特徴とする請求項1記載の方法。
- 前記送り先群内の画像と、前記画像を決定するのに用いた前記画像ソース群内のそれぞれの画像との間で、動き場を決定するステップと、
前記決定した動き場から、前記画像を予測するのに用いた前記ソース群内のそれぞれの画像における少なくとも一つの画素および/またはサブ画素を、前記送り先群内の画像を表現する画像の各画素および各サブ画素と関連付けるステップと、を更に含むことを特徴とする請求項1または2記載の方法。 - 前記送り先群内の画像を表現する画像の各画素および各サブ画素の値は、前記送り先群内の画像を表現する画像の前記画素およびサブ画素と関連付けられた各画素およびサブ画素の値を合計すると共に、その合計を、前記送り先群内の画像を表現する画像の前記画素または前記サブ画素と関連付けられた各画素および各サブ画素の数で割ることで、取得されることを特徴とする請求項3記載の方法。
- 前記送り先群内の画像を表現する画像が、ローパスフィルタによってフィルタ処理されることを特徴とする請求項1〜4のいずれか一つに記載の方法。
- 前記送り先群内の画像と同じ解像度で、サブサンプルされた画像を取得するために、このサブサンプルされた画像が表わす前記送り先群内の画像を表現する画像が、少なくとも一つの離散ウェーブレット分解によってサブサンプルされることを特徴とする請求項5記載の方法。
- 離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を復号化する方法であって、
離散ウェーブレット分解が、前記ビデオ画像配列を2つの画像の群に分割するステップと、
ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する少なくとも一つのステップと、を含むものにおいて、
前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素を、前記表現する画像が構成することを特徴とする方法。 - 少なくとも一つのウェーブレット分解統合を行なうことで、前記ソース群内の前記画像がアップサンプルされることを特徴とする請求項7記載の方法。
- 前記ソース群内の画像と、前記画像を決定するのに用いた各画像の前記送り先群内のそれぞれの画像との間で、動き場を決定するステップと、
前記決定した動き場から、前記画像を予測するのに用いた前記ソース群内のそれぞれの画像における少なくとも一つの画素および/またはサブ画素を、前記送り先群内の画像を表現する画像の各画素および各サブ画素と関連付けるステップと、を更に含むことを特徴とする請求項7または8記載の方法。 - 前記送り先群内の画像を表現する画像の各画素および各サブ画素の値は、前記送り先群内の画像を表現する画像の前記画素およびサブ画素と関連付けられた各画素およびサブ画素の値を合計すると共に、その合計を、前記送り先群内の画像を表現する画像の前記画素または前記サブ画素と関連付けられた各画素および各サブ画素の数で割ることで、取得されることを特徴とする請求項9記載の方法。
- 前記送り先群内の画像を表現する画像が、ローパスフィルタによってフィルタ処理されることを特徴とする請求項7〜10のいずれか一つに記載の方法。
- 各画像の前記送り先群内の画像と同じ解像度で、サブサンプルされた画像を取得するために、このサブサンプルされた画像が表わす各画像の前記送り先群内の画像を表現する画像が、少なくとも離散ウェーブレット分解によってサブサンプルされることを特徴とする請求項11記載の方法。
- 離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を符号化する装置であって、
前記装置は離散ウェーブレット分解手段を備え、
前記離散ウェーブレット分解手段は、前記ビデオ画像配列を2つの画像の群に分割する手段と、
ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する手段と、を備えたものにおいて、
前記符号化する装置は前記表現する画像の形成手段を有し、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素で、前記表現する画像が構成されることを特徴とする装置。 - 離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって、ビデオ画像配列を復号化する装置であって、
前記装置は離散ウェーブレット分解手段を備え、
前記離散ウェーブレット分解手段は、前記ビデオ画像配列を2つの画像の群に分割する手段と、
ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定する手段と、を備えたものにおいて、
前記復号化する装置は前記表現する画像の形成手段を有し、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで各画素と各サブ画素を取得し、この各画素と各サブ画素から決定された各画素と各サブ画素で、前記表現する画像が構成されることを特徴とする装置。 - 情報媒体に蓄積されるコンピュータプログラムであって、
このプログラムは、当該プログラムがコンピュータシステムにロードされ、このコンピュータシステムにより実行されると、請求項1〜6の何れか一つに基づく方法を行なう指令を含んでいることを特徴とするコンピュータプログラム。 - 情報媒体に蓄積されるコンピュータプログラムであって、
このプログラムは、当該プログラムがコンピュータシステムにロードされ、このコンピュータシステムにより実行されると、請求項7〜11の何れか一つに基づく方法を行なう指令を含んでいることを特徴とするコンピュータプログラム。 - ビデオ画像配列を含む信号であって、このビデオ画像配列は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって符号化され、
前記信号は高周波数および低周波数の各画像を含み、これらの各画像は、前記ビデオ画像配列を2つの画像の群に分割すると共に、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定することで取得されるものにおいて、
前記高周波数および低周波数の各画像は、各画素および各サブ画素から取得され、この各画素および各サブ画素は、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで取得した各画素と各サブ画素から決定されることを特徴とする信号。 - ビデオ画像配列を含む信号を送信する方法であって、このビデオ画像配列は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって符号化されたものにおいて、
前記信号は高周波数および低周波数の各画像を含み、これらの各画像は、前記ビデオ画像配列を2つの画像の群に分割すると共に、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定することで取得され、
またこの高周波数および低周波数の各画像は、各画素および各サブ画素から取得され、この各画素および各サブ画素は、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで取得した各画素と各サブ画素から決定されることを特徴とする方法。 - ビデオ画像配列を含む信号を蓄積する方法であって、このビデオ画像配列は、離散ウェーブレット分解を利用する動き補償された時間的フィルタリングによって符号化されたものにおいて、
前記信号は高周波数および低周波数の各画像を含み、これらの各画像は、前記ビデオ画像配列を2つの画像の群に分割すると共に、ソース群と呼ばれる各画像の各群で、その中の一つの群内の各画素で構成される少なくとも一つの画像から、送り先群と呼ばれる別な各画像の群で、その中の画像を表現する画像を決定することで取得され、
またこの高周波数および低周波数の各画像は、各画素および各サブ画素から取得され、この各画素および各サブ画素は、前記ソース群内の少なくとも一つの画像をアップサンプリングすることで取得した各画素と各サブ画素から決定されることを特徴とする方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
FR0407833 | 2004-07-13 | ||
PCT/FR2005/001639 WO2006016028A1 (fr) | 2004-07-13 | 2005-06-28 | Procede et dispositif de codage d’une sequence d’images video |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008507170A true JP2008507170A (ja) | 2008-03-06 |
Family
ID=34949322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007520853A Pending JP2008507170A (ja) | 2004-07-13 | 2005-06-28 | ビデオ画像配列の符号化方法および装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US20080037633A1 (ja) |
EP (1) | EP1766999B1 (ja) |
JP (1) | JP2008507170A (ja) |
KR (1) | KR101225159B1 (ja) |
CN (1) | CN101019436B (ja) |
WO (1) | WO2006016028A1 (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2010095556A1 (ja) * | 2009-02-19 | 2012-08-23 | ソニー株式会社 | 画像処理装置および方法 |
JPWO2010095557A1 (ja) * | 2009-02-19 | 2012-08-23 | ソニー株式会社 | 画像処理装置および方法 |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013049412A2 (en) | 2011-09-29 | 2013-04-04 | Dolby Laboratories Licensing Corporation | Reduced complexity motion compensated temporal processing |
US20180141039A1 (en) * | 2016-11-23 | 2018-05-24 | Access Sensor Technologies | Analyte detection devices and systems |
CN112232430B (zh) * | 2020-10-23 | 2024-09-06 | 浙江大华技术股份有限公司 | 神经网络模型测试方法、装置、存储介质及电子装置 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2002050772A1 (en) * | 2000-12-21 | 2002-06-27 | Unisearch Limited | Method and apparatus for scalable compression of video |
WO2002085026A1 (en) * | 2001-04-10 | 2002-10-24 | Koninklijke Philips Electronics N.V. | Method of encoding a sequence of frames |
WO2003107683A1 (en) * | 2002-06-12 | 2003-12-24 | Unisearch Limited | Method and apparatus for scalable compression of video |
JP2004502358A (ja) * | 2000-06-30 | 2004-01-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオ系列の圧縮のための符号化方法 |
WO2004036919A1 (en) * | 2002-10-16 | 2004-04-29 | Koninklijke Philips Electronics N.V. | Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1205818C (zh) * | 2000-04-11 | 2005-06-08 | 皇家菲利浦电子有限公司 | 视频编码和解码方法 |
US6795504B1 (en) * | 2000-06-21 | 2004-09-21 | Microsoft Corporation | Memory efficient 3-D wavelet transform for video coding without boundary effects |
EP1305952A2 (en) * | 2000-07-25 | 2003-05-02 | Koninklijke Philips Electronics N.V. | Video encoding method using a wavelet decomposition |
CN1201590C (zh) * | 2000-11-17 | 2005-05-11 | 皇家菲利浦电子有限公司 | 使用块匹配处理的视频编码方法 |
US7042946B2 (en) * | 2002-04-29 | 2006-05-09 | Koninklijke Philips Electronics N.V. | Wavelet based coding using motion compensated filtering based on both single and multiple reference frames |
-
2005
- 2005-06-28 JP JP2007520853A patent/JP2008507170A/ja active Pending
- 2005-06-28 KR KR1020067027758A patent/KR101225159B1/ko active IP Right Grant
- 2005-06-28 WO PCT/FR2005/001639 patent/WO2006016028A1/fr active Application Filing
- 2005-06-28 CN CN2005800235025A patent/CN101019436B/zh active Active
- 2005-06-28 US US11/571,946 patent/US20080037633A1/en not_active Abandoned
- 2005-06-28 EP EP05783796.5A patent/EP1766999B1/fr active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004502358A (ja) * | 2000-06-30 | 2004-01-22 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | ビデオ系列の圧縮のための符号化方法 |
WO2002050772A1 (en) * | 2000-12-21 | 2002-06-27 | Unisearch Limited | Method and apparatus for scalable compression of video |
WO2002085026A1 (en) * | 2001-04-10 | 2002-10-24 | Koninklijke Philips Electronics N.V. | Method of encoding a sequence of frames |
WO2003107683A1 (en) * | 2002-06-12 | 2003-12-24 | Unisearch Limited | Method and apparatus for scalable compression of video |
WO2004036919A1 (en) * | 2002-10-16 | 2004-04-29 | Koninklijke Philips Electronics N.V. | Fully scalable 3-d overcomplete wavelet video coding using adaptive motion compensated temporal filtering |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2010095556A1 (ja) * | 2009-02-19 | 2012-08-23 | ソニー株式会社 | 画像処理装置および方法 |
JPWO2010095557A1 (ja) * | 2009-02-19 | 2012-08-23 | ソニー株式会社 | 画像処理装置および方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1766999A1 (fr) | 2007-03-28 |
KR20070040341A (ko) | 2007-04-16 |
CN101019436A (zh) | 2007-08-15 |
EP1766999B1 (fr) | 2019-11-20 |
KR101225159B1 (ko) | 2013-01-22 |
WO2006016028A1 (fr) | 2006-02-16 |
US20080037633A1 (en) | 2008-02-14 |
CN101019436B (zh) | 2013-05-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4896458B2 (ja) | 3dサブバンド符号化のための組み込み基本レイヤコーデック | |
JP4989048B2 (ja) | 3dサブバンド符号化のための組み込み基本レイヤコーデック | |
KR100763194B1 (ko) | 단일 루프 디코딩 조건을 만족하는 인트라 베이스 예측방법, 상기 방법을 이용한 비디오 코딩 방법 및 장치 | |
JP5014989B2 (ja) | 基礎階層を利用するフレーム圧縮方法、ビデオコーディング方法、フレーム復元方法、ビデオデコーディング方法、ビデオエンコーダ、ビデオデコーダ、および記録媒体 | |
KR100772873B1 (ko) | 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더 | |
US7801220B2 (en) | In-band wavelet video coding with spatial scalability | |
KR100664929B1 (ko) | 다 계층 기반의 비디오 코더에서 모션 벡터를 효율적으로압축하는 방법 및 장치 | |
JP5529293B2 (ja) | メタデータによる時間スケーリングのためのエッジエンハンスメントのための方法 | |
US20070217513A1 (en) | Method for coding video data of a sequence of pictures | |
JP2008503981A (ja) | グリッド動き推定/補償を用いたスケーラブルビデオ符号化 | |
US20060120448A1 (en) | Method and apparatus for encoding/decoding multi-layer video using DCT upsampling | |
JP2008541653A (ja) | スムージング予測を用いた多階層基盤のビデオエンコーディング方法、デコーディング方法、ビデオエンコーダ及びビデオデコーダ | |
CN112866697B (zh) | 视频图像编解码方法、装置、电子设备及存储介质 | |
JP2008507170A (ja) | ビデオ画像配列の符号化方法および装置 | |
JP4844455B2 (ja) | 映像信号階層復号化装置、映像信号階層復号化方法、及び映像信号階層復号化プログラム | |
JP4844456B2 (ja) | 映像信号階層符号化装置、映像信号階層符号化方法、及び映像信号階層符号化プログラム | |
EP1889487A1 (en) | Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction | |
KR20070040342A (ko) | 움직임 필드 고밀도화 방법 및 장치 | |
Wu et al. | Lossless Compression Using Joint Predictor for Astronomical Images | |
Yabu-uti | HIERARCHICAL IMAGE COOING WITH PYRAMID DPCM |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080530 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20110422 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20110912 |