JP2008289132A - データセットを変換係数に変換する方法 - Google Patents
データセットを変換係数に変換する方法 Download PDFInfo
- Publication number
- JP2008289132A JP2008289132A JP2008096670A JP2008096670A JP2008289132A JP 2008289132 A JP2008289132 A JP 2008289132A JP 2008096670 A JP2008096670 A JP 2008096670A JP 2008096670 A JP2008096670 A JP 2008096670A JP 2008289132 A JP2008289132 A JP 2008289132A
- Authority
- JP
- Japan
- Prior art keywords
- subband
- block
- data set
- image
- grouping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/134—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
- H04N19/146—Data rate or code amount at the encoder output
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/90—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/48—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/50—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
- H04N19/503—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
- H04N19/51—Motion estimation or motion compensation
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/61—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
- H04N19/619—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding the transform being operated outside the prediction loop
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
- H04N19/63—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
- H04N19/64—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
- H04N19/645—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission by grouping of coefficients into blocks after the transform
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/115—Selection of the code volume for a coding unit prior to coding
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Complex Calculations (AREA)
Abstract
【課題】ビデオ画像を表しているデータを効率的に符号化して、それにより復号器へ移されなければならないデータ量を減らす方法と装置を提供する。
【解決手段】残りを一方のサブバンドからもう一つのサブバンドへ伝送することができるテンソル積小波変換を利用してデータセットを変換することを含む。サブバンドの集合(マクロブロック形式になっている)が重みを付けられ、検出され、そして順序付けられて変換されたデータの優先順位付けを可能にする。動き補償技術が復号器へ伝送のためにビットストリーム・パケットに位置的に符号化される動きベクトルと予測誤差を生成するサブバンド・データで実行される。サブバンド・マクロブロックとゼロに等しいサブバンド・ブロックが復号器へ移されなければならないデータ量をさらに減らすためにビットストリーム・パケットにあるようなものとして識別される。
【選択図】図1
【解決手段】残りを一方のサブバンドからもう一つのサブバンドへ伝送することができるテンソル積小波変換を利用してデータセットを変換することを含む。サブバンドの集合(マクロブロック形式になっている)が重みを付けられ、検出され、そして順序付けられて変換されたデータの優先順位付けを可能にする。動き補償技術が復号器へ伝送のためにビットストリーム・パケットに位置的に符号化される動きベクトルと予測誤差を生成するサブバンド・データで実行される。サブバンド・マクロブロックとゼロに等しいサブバンド・ブロックが復号器へ移されなければならないデータ量をさらに減らすためにビットストリーム・パケットにあるようなものとして識別される。
【選択図】図1
Description
本発明は、一般的にいえば装置とビデオ情報を符号化して、復号する方法に関する。より詳しくいえば、本発明は装置と変換ドメインにおけるデータセットを変換係数に変換する方法に関する。
関連出願についてのクロス・リファレンス
本願は、1997年11月14日出願の暫定出願番号60/066,638に対する優先権を主張し、それは本明細書において引用して組入れられている。
本願は、1997年11月14日出願の暫定出願番号60/066,638に対する優先権を主張し、それは本明細書において引用して組入れられている。
伝送路に利用可能な帯域幅が限られているために、音声とビデオ情報を符号化するために限られた数のビットだけしか利用できない。ビデオ符号化技術が与えられた用途に必要とされる画質をなお、維持しながら、できるだけ少ないビットでビデオ情報を符号化しようとしている。したがって、ビデオ圧縮技術が冗長な情報を除き、重要な特徴の損失を最小にして元の画像に近似したものを再構成できる最小のビットで残りの情報を表すことによってビデオ信号を伝えるに必要な帯域幅を減らそうとしている。このようにして、圧縮データを元の画像データより有効な方法で記憶又は伝送できる。
ビデオ信号から統計的冗長性を除くことによって符号化効率を改良する多くのビデオ符号化技術がある。多くの標準の画像圧縮方式は、離散的コサイン変換(DCT)のような入力画像のブロック変換に基づいている。例えば、映画専門家グループによって開発された周知のMPEGビデオ符号化技術は、空間ドメイン(DCT使用して)における画素(ペル)間の相関と時間ドメイン(予測と動き補償を使用して)の画像枠間の相関を利用することによってかなりのビットレート削減を達成している。
システム(含めて重ねられた直交する変換の)を符号化して基礎を形成される周知の直交及び二直交(サブバンド)変換において、画像がその画像を最初にブロック化する必要なしに変換される。DCTに基づく変換符号器は、画像を最初にブロック化する必要なしに変換する。DCTに基づく変換符号器は、主に二つの理由で画像をブロック化する、すなわち、1)経験によってDCTが画像の8×8領域又は一連の差画像ついての既知の最適変換(カルーネン・ルーベ)に対する良好な近似であることを知った、及び2)DCTの処理は、O(NlogN)を増大させて、画像のブロック化によって計算努力が制限される、ということである。
最終結果は、DCTをベースにした方法が、特に高められない限り、画像の8×8領域によって(又は直ぐ外側に)コンパクトに支えられる基素機能を有する。考慮中の直交及び二直交変換は、画像の有限の間隔内に主に支持される基素部材を有するが、範囲を隣接した空間領域と共有する。サブバンド画像符号化技術、例えば、1組のフィルタを用いて一つの入力画像を複数の空間周波数帯域に分割し、各帯域又はチャネルを量子化する。サブバンド画像符号化技術の詳細な議論については、SPIE第1666巻「人間の視力、視覚処理及びデジタル表示III」、pp.241−52(1992年2月)のシー・ポディルチャック(C.Podilchuck)及びエイ・ジャッキン(A.Jacquin)著「動的ビット割当及び幾何学的ベクトル量子化でのサブバンド・ビデオ符号化」(Subband Video Coding With Dynamic Bit Allocation and Geometric Vector Quantization)を参照されたい。サブバンド符号化方法の各段階で、信号は、画像の低域通過近似とその近似を作ることによって失われた細部を表す高域項に分割される。
それに加えて、DCTベース変換符号器は、ベース部材が8×8ブロック全体にわたって伸びる支えを有するという意味で変換不変量である。これは、動き補償が変換ドメインにおいて能率的に行われないようにする。したがって、使用中の大部分の動き補償技術は、8×8ブロックに符号化された変換である誤差項を作るために隣接画像フレームを一時的に利用する。結果として、これらの技術は、基準フレームを周波数領域から時間領域に与えるために行われるべき逆変換を必要とする。このようなシステムの例は、鈴木ほかの米国特許第5,481,553号と村上ほかの米国特許第5,025,482号にある。
図1は、DCTを使用している従来の標準ビデオ圧縮方法の略ブロック図を示す。ブロック10において、画像シーケンス内の変化は、予測モードにあるときMPEGにおいて使用される一つの技術のような動き検出技術によって能率的に表される。特に、前のフレームが基準のフレームとして使われ、前向き予測において、次のフレームが時間的冗長性をなくして、度合に従ってそれらの間の差に順位を付けるために前のフレームと比較される。このステップは、次のフレームの動き予測の段階を設定するとともに次のフレームのデータの大きさを小さくする。
ブロック12において、判定が画像のどの部分が動いたかについてなされる。ブロック10によって与えられたデータセットを使用して、MPEGの例を続けると、フレーム間の動き予測は、動き補償技術を基準フレームと次のフレームに適用することによって実施される。結果として生じる予測は、予測誤差/フレームを生成するために次のフレームから引かれる。その後で、ブロック14において、変化は特徴に変換される。MPEGにおいて、これは2次元の8×8のDCTを使用している予測誤差を圧縮することによって行われる。
DCT又はサブバンド・符号器に基づく大部分のビデオ圧縮技術は、変換段階において正確さを失うことなくビデオ情報を符号化しようとする高精度技術に集中した。そのような高精度符号化技術は、比較的費用のかかるマイクロプロセッサ(例えばインテル社PENTIUM(商標)プロセッサ)に依存する。そして、それは、浮動小数点演算の操作において助けとなり、それによって高精度を維持することに対するペナルティーを少なくする専用のハードウェアを有している。
しかし、多くのアプリケーションの場合、そのような比較的高価なハードウェアは、実際的でないか又は価値があると認められていない。したがって、安くて受け入れ可能な画像品質水準をも維持する具体化が必要である。しかし、低価格のハードウェアで実行できる既知の限られた精密変換は、符号化プロセスが「損失のある」性質であるために、低い精度を示す傾向がある。ここで使用しているように、「損失のある」システムは、符号器の種々の段階を通して精度を失って、それにより復号のとき変換係数からの入力をほぼ復元する能力を欠いているシステムに関する。これらの低精度変換によって示された精度低減を補償することができないことは、そのような変換を使用することに対して障害であった。
前述のことからみて、変換ドメイン内で動き補償を行い、それにより符号器における逆変換の必要をなくして、ソフトウェアとハードウェア装置のための単純な制御構造を可能にするビデオ符号器が要求されている。また、低価格のハードウェアと高速ソフトウェア装置を可能にする制御構造を含む低精度具体化に適している変換のクラスを有するビデオ符号器のための技術的要求もある。
米国特許第5,481,553号
米国特許第5,025,482号
SPIE第1666巻「人間の視力、視覚処理及びデジタル表示III」、pp.241−52(1992年2月)のシー・ポディルチャック(C.Podilchuck)
エイ・ジャッキン(A.Jacquin)著「動的ビット割当及び幾何学的ベクトル量子化でのサブバンド・ビデオ符号化」(Subband Video Coding With Dynamic Bit Allocation and Geometric Vector Quantization)
本発明は、データを圧縮するための新規で独特な装置と方法を目的とする。さらに詳しくいえば、本装置と方法は、例えば、ビデオ画像を表すデータをより能率的に符号化し、それにより復号器へ移されなければならないデータ量を減らすように適応されて構成される。
本発明は、第1のデータセット及び第2のデータセットを含むデータを圧縮する方法に関する。この方法は、第1及び第2のデータセットを対応する第1及び第2の変換係数セットに変換することを含んでいる。その後で、第1及び第2の変換係数セット間の差を表すデータが生成される。生成されたデータは、次に復号器に伝達するために符号化される。
第1及び第2のデータセットを変換することは、テンソル積小波変換を利用して実行されてもよい。さらに、変換方法から生ずる残りは、一つのサブバンドからもう一つのサブバンドへ送ることができる。
第1及び第2の変換係数セット間の差を表すデータは、動きベクトルを与えるように第1及び第2の変換係数セット間の差を評価することによって生成される。動きベクトルは、第2の変換係数セットの予測を作るために第1の変換係数セットに適用される。その予測は、第2の変換係数セットから引かれて1組の予測誤差を生ずる。第1及び第2の変換係数セットは、符号器と復号器の間の同期を確実にするために誤差を修正されることができる。
第1及び第2の変換係数セット間の差を評価する際に、検索領域が第1及び第2の変換係数セットの一方から変換係数のサブセットの回りに生成される。その後で、変換係数の関連のサブセットが第1及び第2の変換係数セットのもう一方から検索領域に加えられる。次に、変換係数の関連のサブセットは、最良増分一致を表す位置へ検索領域内を増分的に横に動かされる。次に、前記関連のサブセットは、最良分数一致を表す位置へ検索領域内を分数的に横に動かすことができる。
第1のデータセットと第2のデータセットを含むデータを圧縮する方法のもう一つの実施例は、第1及び第2のデータセットをサブバンドの対応する第1及び第2の集合に変換することを含む。次に、サブバンドの第1及び第2の集合間の差を表すデータを生ずる。このデータは、例えば、動き補償技術を実施することによって生成できる。動き補償技術は、動きベクトル及び予測誤差などの出力を与えることができる。その後で、生成されたデータは、復号器に伝達するために符号化される。
一つの実施例がまた、サブバンド・マクロブロック・クルーピングを形成するようにマクロブロック・パッキングされた第2の集合であってもよい。その後で、生成されたデータを次のように動き補償技術によって得ることができる。サブバンドの第1の集合とサブバンド・マクロブロック・グルーピングの間の差は、動きベクトルを与えるために評価される。動きベクトルは、サブバンドの第1の集合に加えられてサブバンドの第2の集合の予測を作る。この予測は、それからサブバンドの第2の集合から引かれて1組の予測誤差を生ずる。
これらの差は、次のようにサブバンドとサブバンド・サブバンド・グルーピングの第1の集合の間で次のように評価することができる。検索領域がサブバンドの第1の集合から変換係数のサブセットの周りに生成される。サブバンド・マクロブロック・グルーピングからの変換係数の関連サブセットが検索領域に適用される。変換係数の関連サブセットは、次に最良増分一致を表す位置へ検索領域内を増分的に横に動かされる。次に、変換係数の関連サブセットは、最良分数一致を表す位置へ検索領域内で分数的に横に動かされる。
画像の変換から得られるサブバンドの集合のサブバンド・ブロックを編成するサブバンド・マクロブロック・パッキング方法もまた、開示される。この方法は、画像内の画像マクロブロックに対応するサブバンドの集合から1組の関連のサブバンド・ブロックを分離することを含む。関連のサブバンド・ブロックの組は、サブバンド・マクロブロックと一つとしてパックされる。分離及びパッキングに関連したサブバンド・ブロックのステップは、サブバンド・マクロブロック・グルーピングを形成するためにサブバンドの集合における関連サブバンド・ブロックの各セットに対して繰り返される。
マクロブロック・パッキングの方法は、サブバンド・ブロックがサブバンドの集合において占めるのと同じ相対位置にサブバンド・マクロブロック内の関連サブバンド・ブロックの組を配列することによってさらに精密にできる。この方法はまた、対応する画像マクロブロックが画像マクロブロック・グルーピングの中で位置するのと同じ空間位置にサブバンド・マクロブロック・グルーピング内のサブバンド・マクロブロックの位置を決めることを含む。
マクロブロック・パッキングの後、変化を第1のサブバンド・マクロブロック・グルーピング(基準)と次の第2のサブバンド・マクロブロック・グルーピングの間で検出できる。検出ステップは、次の形の一般式
ここで:
ec=基準Rに対するゆがみの測定値、
Wi=適用された重み、
G=第2のサブバンド・マクロブロック・グルーピングの変換係数、
及び
R=基準(例えば第1のサブバンド・マクロブロック・グルーピング)
に従うゆがみ計算に基づく。
ここで:
ec=基準Rに対するゆがみの測定値、
Wi=適用された重み、
G=第2のサブバンド・マクロブロック・グルーピングの変換係数、
及び
R=基準(例えば第1のサブバンド・マクロブロック・グルーピング)
に従うゆがみ計算に基づく。
本発明のもう一つの実施例が一つのデータセットを変換係数に変換するための有限精密法として記述されており、その方法では、データセットがテンソル積小波対を利用して変換され、そこから出ている残りは、反対側のフィルタ経路に伝搬される。さらに詳しくいえば、この実施例は画像の低域通過構成要素と高域通過構成要素を決定することを含むことができる。低域通過構成要素は、低域通過正規化出力と第1の残り(rl)を生成するために正規化される。同様に、高域通過構成要素は、高域通過正規化出力と第2の残り(rh)を生成するために正規化される。第1の演算(g(rl,rh))が第1及び第2の残り(rl(rh))について行われ、それから出る結果が近似に加えられる。そして、第2の演算(f(rl,rh))もまた、第1及び第2の残り(rl(rh))について行われて、それから出ている結果が詳細部に加えられる。残り(誤差の伝達)の伝搬をいかなる変換においても使うことができるが、ただテンソル積にはできない点に注意することが重要である。
上記の有限精密法によると、画像の表現が完全過ぎるものになる。この方法は、変化ドメイン内の画像を表す必要かつ充分な変換係数を得るために高域通過と低域通過構成要素の、ダウンサンプリング、例えば二つだけ、をすることを含むことができる。
有限の精密法の実施例が値−1、2、6、2、−1を有する低域通過フィルタ及び値−1,2、−1を有する高域フィルタを備えている。
第1の演算(g(rl,rh))と第2の演算(f(rl,rh))は、以下の関数を有する、
g(rl,rh)=rh、
及び
f(rl,rh)=floor(rh+/2)、
ここでnh =1/2。
第1の演算(g(rl,rh))と第2の演算(f(rl,rh))は、以下の関数を有する、
g(rl,rh)=rh、
及び
f(rl,rh)=floor(rh+/2)、
ここでnh =1/2。
上記を含んでいるテンソル積小波変換の特定の例は、次式を有する
及び
ここで
X2i=入力データ、
X2i−1=入力データX21に先行するデータ
X2i+1=あとに続くデータは、dataX2、
Di=詳細部項(高域フィルタ出力の10分の1を取った)、
Di+1=詳細部項Dのあとに続く詳細部項、
及び
Ai=近似項(低域フィルタ出力の10分の1を取った)。
及び
ここで
X2i=入力データ、
X2i−1=入力データX21に先行するデータ
X2i+1=あとに続くデータは、dataX2、
Di=詳細部項(高域フィルタ出力の10分の1を取った)、
Di+1=詳細部項Dのあとに続く詳細部項、
及び
Ai=近似項(低域フィルタ出力の10分の1を取った)。
また、変換ドメインにある一連のフレーム間の変化を予測する符号器装置が開示される。この装置は、一連のフレームの第1及び第2フレームを受けるように構成され、さらに、それから各々が1組の変換係数を支援する対応するサブバンドの第1及び第2の集合を生成するように構成された入力を有する変換装置を備えている。変換装置に連結された入力を有する動き補償装置は、サブバンドの第1及び第2の集合を受けるように構成されて、さらにサブバンドの第1及び第2の集合間の差を効率よく表すように構成されている。また、変換装置に連結された入力と動き補償装置の出力に連結された入力を有する差ブロックが含まれる。動き補償装置から受けられる入力は、差ブロックにあるサブバンドの第2の集合から引かれ、それにより予測誤差を生成する。
動き補償装置は、サブバンドの第1及び第2の集合を比較するように構成された動き評価装置を備えている。動きベクトルの集合がそこから生成され、それはサブバンドの第1及び第2の集合間の差を近似的に表す。動き補償装置はまた、入力を動き評価装置に連結されて、サブバンドの動きベクトルと第1の集合を受けるように構成されて、さらにそこからサブバンドの第2の集合の予測を表す予測グルーピングを生成するように構成された動き予測装置を備えている。サブバンドの第2の集合の予測は、差ブロック内のサブバンドの第2集合から引かれて予測誤差を得る。
画像フレームを変換ドメインに変換する有限精密変換装置もまた、開示されている。この装置は、並列配列されて画像フレームを受けるように構成された入力を共有する低域通過構成要素と高域通過構成要素を備えている。低域通過構成要素の出力を受けるように構成された入力を有しさらに、低域通過正規化出力及び第2の残り(rl)を作るようにさらに構成された低域通過正規化装置が設けられている。高域通過正規化装置が高域通過構成要素の出力を受けるように構成された入力を有しさらに、高域通過正規化出力及び第2の残り(rl)を作るようにさらに構成されている。第1の演算装置が入力を第1の残り(rl)と第2の残り(rh)を受けるように構成されて、さらに、第1の計算(g(rl,rh))を計算するように構成され、それによって第1の計算結果を生成する。第2の演算装置が入力を第1の残り(rl)と第2の残り(rh)を受けるように構成されて、さらに、第2の計算(f(rl,rh))を計算するように構成され、それによって第1の計算結果を生成する。なお、第1の加算器が低域通過正規化出力と第1の算出結果を受けるように構成された入力を有し、前記第1の加算器はサブバンド近似を生成する。同様に、第2の加算器が低域通過正規化出力と第2の計算結果を受けるように構成された入力を有し、第2の加算器がサブバンド詳細部を生成する。
有限精密変換装置は、さらに低域通過出力での第1のダウンサンプラ(標本化数を下げて標本化する回路)と高域通過出力での第2のダウンサンプラを含む。2のダウンサンプリング(標本数を下げて標本化すること)は、復号器において入力画像を復元するために充分かつ必要な変換係数を与える。
本明細書において開示した装置と方法のこれら及びその他のユニークな特徴は、図面とともに行われる以下の詳細な説明からさらに容易に明らかになるだろう。
本発明の実施例が限られた精密変換技術を用いてディジタルビデオ信号を圧縮する装置及び方法を与える。その実施例は、従来の無損失又は有損失変換に基づいた技術について、従来技術におけるような時間ドメインではなく、変換ドメインにおいて、動き補償、例えば、動きを評価して予測すること、によって改良する。こうして、改良された画質をより安価なハードウェアにおいて達成できる。
用語「動き補償」は、最も広義に定義されることを意図している。換言すれば、動き補償が本明細書において一群の画素の動き評価と動き予測を含むものとして記載されて、図示されていることが多いが、例えば、回転とスケールを包含するといることも理解されるべきである。それに加えて、例えば、用語「動き補償」は、2セットのデータ間の差を表わすデータを簡単に生成することを含んでいてもよい。
圧縮効率が画像を特徴に変換することと最初に特徴を図にすることの両方によって得られる。本明細書における開示は、それが一連の画像又はビデオ・フレームに関するとして示されている。そのような画像シーケンスは、容易に、互い整列して置かれて、時間又は何らかの他のパラメータによって割出される空間的に配位されたデータ要素(スカラー、ベクトル又は関数的のいずれか)であると理解できる。画像シーケンスは直角座標系にあるようにできるが、従来技術における他の座標系を用いることもできる。
なお、現在の装置と方法は、非ビデオ・アプリケーション(例えばスピーチ、音声及び心電図圧縮)において利用できる。すなわち、たとえ本明細書において開示された発明が二次元のシステム(2D)(すなわちビデオ圧縮)に図示されているとしても、教示が一般にデータ圧縮の技術を進めるために他のいかなる次元のシステムにも適用できることを意図している。
例えば、教示は、超音波イメージングなどの1−1/2の次元のシステム(1−1/2D)に適用できる。また、教示は、3次元のシステム(3D)(例えば磁気共鳴イメージング(MRI))に適用することもできる。
下記の説明の全体にわたって、用語「フレーム」は、単一画像の形に関係なく、すなわち、それが時間領域、周波数領域にあるか又はそれになされたどんな他の処理のものであるかどうかに関係なく、符号器に送られた一連の画像中の単一画像に関する。その他に、用語「ベル」は、時間領域の画素に関して使われ、用語「係数」と「変換係数」は、例えば、ベルが前方小波変換を通過したあとに発生されるベルの表示に関して使われる。これらの用語は、実施例の説明を容易にするために用いて、決して本発明の範囲を制限することを目的としていない。
同様な参照番号が本発明の同様の要素を識別している図面を、ここで参照すると、図2において一連の画像又は一連のフレームを圧縮するための実施例の略ブロック図で示されている。この線図は、本明細書において開示されるいくつかの実施例のうちの一つである。より詳細な実施例を以下の節において論ずる。
図2において、一つの画像がブロック20において変換ドメイン内の特徴の集合に変換される。その画像に対して有意であると決定された特徴(すなわち、過去又は基準フレームからかなり変化したと決定されるそれらの特徴)は、ブロック22において選ばれる。有意な特徴は、ブロック24において効率的に表されて、その後で、基準フレーム内の特徴を更新するために復号器に送られる。
例えば、元の画像は、ブロック20において変換されて、変換係数セットによって表される。係数セットの変換係数は、次に種々の重み付け及び評価技術よってそれらの有意性を決定するためにブロック22において評価され、次に重みに従って順位を付けられる。その後で、ブロック24において、現在のフレームと過去又は基準フレームの間の動き補償が起こる。動き補償は、1組の動きベクトルを生成するためにフレーム間の変化を評価する動きを含むでいてもよい。その後で、動きベクトルは、動き予測ステップの間に基準フレームに適用される。動き予測からの結果は、その予測の誤差を決定するために変換係数セットから引かれる。予測誤差は、次に任意選択的に拡大・縮小されて、復号器に伝送のための動きベクトルとともに最後に位置的に符号化される。
図3を参照すると、略ブロック線図が図2に関して記載された実施例のより詳しい構成を示している。例えば、カルテック中間フォーマット(Caltech Intermediate Format(CIF))において符号化された画像シーケンス又は一連のビデオ・フレーム26がコンバータ28に送られる。CIFフレームは、288×352ペルを有する。コンバータ28において、フレームは、4分の1CIF(QCIF)、例えば図4(a)に図示したようなQCIF画像30、に変換される。QCIF画像は、144×176ペルを有する。CIFは、水平方向と垂直方向の両方において二つだけ低域通過フィルタリングして10分の1を取ることによってQCIFに変換される。処理を容易にするために、144×176ペルは、各々16×16ペルを有する画像マクロブロック(IMBx,x)に分割される。QCIFが、例としてだけ本明細書において使われて、本発明に関する限界として全く考えられていない。後術の技術は、容易にその他の画像(及び非画像)フォーマットに当業者にとって公知の方法で適応できる。
図3と4を参照すると、QCIF画像30は、画像の特徴への写像が起こる図2のブロック20を形成するブロック32と36に送られる。さらに具体的には、QCIF画像30(図4(a))は、前方小波変換が各フレームをサブバンドの集合34(図4(b))に変換するブロック32に送られる。変換された画像(すなわちサブバンドの集合34)のこの編成は、例えば、動き評価、動き予測と予測誤差の決定のためなどに後で使用するためにメモリーに記憶される。本発明のために使用できる適当な前方小波変換は、本明細書において更に詳細に以下に論じる。
サブバンドの集合34は、サブバンド・マクロブロック・パッキングのためのブロック36に送られる。サブバンド・マクロブロック・パッキングの間に、特定の画像マクロブロックに対応するサブバンド・ブロックは、サブバンド・マクロブロック(SMBx,x)を形成するように編成される。その後で、各サブバンド・マクロブロックは、それが関係するので表す画像マクロブロックの空間的に常駐する。特定のフレームのための全てのサブバンド・マクロブロックの集合は、サブバンド・マクロブロック・グルーピング40と呼ばれている。
図5は、サブバンド・マクロブロック・パッキングの方法を示す。サブバンド・マクロブロック・パッキングの間、サブバンド34(図5(a))の集合内の全関連サブバンド・ブロックは、図5(a)に示したようなサブバンド・マクロブロック38を形成するためにサブバンド・マクロブロック・パッキングの間に再編成される。
例えば、図4(a)の画像マクロブロック2,4(1MB2,4)に対応する図5(a)の影付きサブバンド・ブロックは、図5(b)に示したようなサブバンド・マクロブロックSMB2,4を形成するためにブロック36(図3)におけるサブバンド・マクロブロック・パッキングの間に再構成される。サブバンド・マクロブロック38(SMBo,o乃至SMB8,10)は、次に、各サブバンド・マクロブロックがQCIF画像30の中の対応する画像マクロブロック(IMBx,x)の空間位置によって裏付けられるように、サブバンド・マクロブロック38(図5(c))に図示したように、サブバンド・マクロブロック・グルーピング40に構成される。この例では、SMB2,4は、図4(a)と図5(c)に示されたように、1MB2,4の空間的位置によって有意に裏付けられていることが分かる。
本明細書において記載されている実施例がQCIFで表されたフレーム画像だけに言及しているが、当業者は、他のフォーマットを本発明の教示から逸れることなく使うことができると容易に理解するだろうことを再び特記することが重要である。各サブバンド・マクロブロックにおけるサブバンド・ブロックの特定のグルーピングが図示された特定の小波を適応させるために用いられる点に注意することもまた、重要である。他の小波に対してより適当であるサブバンド・データの他のグルーピングが存在する。
画像マクロブロックの集合30(図4(a))、サブバンドの集合34(図4(b))及びサブバンド・マクロブロック・グルーピング40(図5(c))の上記の説明から多少の画像マクロブロック、サブバンド・ブロックとサブバンド・マクロブロックの間に相関があることは、容易に明らかなはずである。そのような相関の例は、次の通りである:(a)画像マクロブロック2,4(1MB2,4)。それは、影をつけられて、更に図4(a)の画像マクロブロック106として識別される、(b)図4(b)の影付サブバンド・ブロック(例えばサブバンド00(SBoo)内のサブバンド・ブロック116及びサブバンド33(SB33)内のサブバンド・ブロック118)の全て及び、(c)図5(c)において、影を付けられるとともにサブバンド・マクロブロック117として識別されたサブバンド・マクロブロック2,4(SMB2,4)。上に例示されたもののような関係を有する係数を含むこの明細書の説明が「関連の」あるとしているといわれることがある。
図3を再び参照すると、サブバンド・マクロブロック・グルーピング40が図2にあるブロック22を形成するブロック42、46、48及び52に送られる。図2では、特徴又はサブバンド・マクロブロック(SMB0,0乃至SMB8,10)が変わったことを決める。特に、重みがサブバンド・マクロブロックの知覚的重要性をならす量だけサブバンド・マクロブロック・グルーピング40にある各サブバンド・マクロブロックを拡大・縮小するために適用されるブロック42に送られる。重み付けブロック42の出力は、重み付きグルーピング44である。
重み付けによる知覚重要性を、例えば、Mean Opinion Score研究によって決めることもできるし、又は、Consultative Committee for International Telegraph and Telephone(CCITT)(それの規格は、本明細書において参照することによって組み入れられている)のH.261とH.263にあるような他の符号化システムにおいて用いられた重みからも決定できる。Mean Opinion Scoringの検討のために、本明細書に参照することによって組み入れられたケイ・アール・ラオ(K.R.Rao)ケイ・アール及びピー・イップ(P.Yip)著「離散的コサイン変換」(Discrete Cosine Transform)、アカデミック・プレス社(pp.165−74(1990))を参照のこと。重みが各サブバンド・マクロブロックを拡大・縮小するためにブロック42において適用されたあと、重み付きグルーピング44は、変化検出ブロック46に送られて、そこで処理され、起こった変化の相対量を決定される。この変化は、また、「有意性」又は、ビデオの場合には、重み付きグルーピング44のゆがみと呼ばれる。有意性を与えられた基準(例えばゼロ又は過去の重み付きグルーピング)に関して決定できる。変化・検出ブロック46から伸びているループは、過去の重み付きグルーピングを基準として使用するために変化・検出ブロック46に返すフレーム・ディレー48を備えている。変化・検出ブロック46の出力は、変化を検出されたグルーピング50である。
ゼロ基準が、例えば、符号器を通じてフレームを最初に伝えるとき、変化・検出ブロック46において使われる。この場合、フレーム全体は、ゼロに照合される。これは、また、フレーム内照合として知られている。上記の通りに、過去のマクロブロック・グルーピングが上記の通りにブロック42において重みを付けられ、その後で、基準として使用するために変化・検出ブロック46の遅延ブロック48において遅らされる重み付きグルーピングもまた使うことができる。また、フレーム間照合として知られているこの後者の方法は、冗長な及び/又は重要でない情報を復号器に繰り返し送ることをなくす。
ゼロフレーム照合の択一的使用が、システムの動作中、復号器での比較的正確な基準画像を再生して、維持するために行われる。一つの方法は、ゼロ基準を標準の30フレーム/秒の割合で8番目ごとのフレームの全部に周期的に適用することを使う。代わりに、画像は、サブバンド・ブロックをゼロにランダムに又は整然として照合することによるなどで確率的にリフレッシュできる。フレームの全て又は一部分をゼロに照合するいかなる方法もを容易にするために、ゼロ照合されたサブバンド・ブロックは、変化をもたらされたブロックについて行われるべき動き補償演算(後術)を妨げるためのようなものとして識別される。したがって、識別されたサブバンド・ブロックは、場合により、そのブロック内の基準全体又は基準の一部分をリフレッシュするために復号器において全部再生される。
図3を再度参照すると、メモリーに以前に記憶されたサブバンドの集合34と変化を検出されたグルーピング50のサブバンド・マクロブロックは、各サブバンド・ブロックが変化したと決められた量、すなわちそれらの有意性と一致している量、に従ってブロック52において順序付けされる。順序付けは、ブロック42と46にあるサブバンド・マクロブロックにそれぞれ重みを付けるのと検出するのを行うことによって先に割り当てられた値に基づいている。ブロック52の出力は、線55を通して送られる順序付けサブバンド・グルーピング53と順序付サブバンド・マクロブロック・グルーピング54を備えている。
図3の参照を続けると、順序付サブバンド・グルーピング53と順序付サブバンド・マクロブロック・グルーピング54は、変更マクロブロックは、効率的に表されている図2のブロック24と対応するブロック56、60、62、68、72及び76へ選択的に送られる。特に、順序付けサブバンド・マクロブロック・グルーピング54(「現在の」フレーム)は、動き評価のためのブロック56に送られる。順序付サブバンド・グルーピング53は遅延ブロック62に送られ、そのあと、ブロック56と60の動き評価と動き予測のために遅延した順序付サブバンド・グルーピング57(「照合」フレーム)を線64に与える。動きベクトル58の集合が、以下に記載する方法で、動き評価ブロック56において生成され、動き予測のためのブロック60に送られるとともに、位置的符号化のためのブロック76にも送られる。
動き予測ブロック60に送られた動きベクトル58は、予測されたグルーピング66を生成するために遅延順序付サブバンド・グルーピング57を変更するのに用いられる。差ブロック68は、順序付サブバンド・グルーピング53を受けて、そこから予測されたグルーピング66を引き、グルーピング差70(すなわち予測誤差)を得る。グルーピング差70は、さらに、ブロック72において拡大・縮小され、拡大・縮小されたグルーピング差74になる。当業者は、非ゼログルーピング差70の数が少なければ少ないほど、動きベクトル58の集合が現在のフレームと基準フレームの間の変化をより正確に予測したことを認めるであろう。そして、差が少なければ少ないほど、動き評価における不備を補正するために復号器に送られなければならないビットは少ない。
拡大・縮小ブロック72からの拡大・縮小されたグルーピング差74と動き評価ブロック56からの動きベクトル58の集合は、ブロック76のマクロブロックとして位置的に符号化される。そこにおいて、データは効率的にビットストリームに編成される。符号化されたビットストリーム・グルーピング78は、ブロック76から出力され、逆処理のための復号器82に伝送線80を通して伝送される。伝送を様々な媒体、例えば電子的、電磁的又は光学的媒体を通じてできる。
ビットストリーム書式設定に関して、ビットストリームの書式を設定する技術には周知のいくつかの標準的方法がある。H.263 ベースの符号器システムにおいて使用される書式は1例である。ビットストリームが基本的にビット・パケットの直列ストリングである。各パケットはデータの特定の部類を表している。
例えば、ビット・パケットは、システムレベル・データ、ビデオ、制御及び音声データを含むことができる。データがブロック76の位置的符号化のために受けられると、それは使用中の書式に従ってビット・パケットに構成される。一般に、ビデオ・フレームを表しているビット・パケットの集合は、それを新しいフレームと識別するビットで始まる。量子化の量及びその他の制御コードは、一般にあとに続く。その後で、拡大・縮小されたグルーピング差74を表しているマクロブロックのリストが符号化される。QCIFの場合、マクロブロックの数は、99に等しい。(図5(c)を参照のこと。)
より効率的なデータ転送を容易にするために、各マクロブロックがマクロブロックにゼロでないデータの有無を示すマクロブロック・ゼロビット(MBZero−bit)によって先行される。マクロブロックが存在する場合、動きベクトル58の関連の集合を含んでいるマクロブロックのための制御情報が送られ、その後にサブバンド・データ、すなわち関連の拡大・縮小されたグルーピング差74が続く。そのような情報を含むことは、マクロブロックの欠如がゼロに等しいマクロブロック係数の全ストリングを識別するのに必要である全ビットの代わりに単一の記号によって表されるので、伝送線80を通して送られるビットの数を著しく減らす。
それ以上の効率をもつことができるもう一つの状況は、サブバンド・マクロブロック内のサブバンド・ブロックのほんの幾つかだけがゼロであるときである。ある実施例は、ゼロに等しい係数を有するサブバンドにサブバンド・ゼロフラグ(SBZero flag)を立てるステップを含む。拡大・縮小されたグルーピング差74からのゼロである係数を持つサブバンドは、順序付サブバンド・グルーピング53の対応するサブバンド・ブロックと予測されたグルーピング66との間に変化があると分らなかったことを示す。ゼロに等しくなっている各係数を別々に表すより、SBZeroフラグを表すに必要なビットの方が著しく少ない。もちろん、復号器は、ブロック76における位置的符号化の間に導入された記号を解釈するためにMBZero−bitとSBZeroフラグの両方を認識するようにプログラムされる。
図3を続けて参照すると、符号化されたビットストリーム・グルーピング78は、伝送ライン80を経た復号器82によって受けられて、位置的符号化ブロック76の効果を逆にする位置的復号化ブロック86に送られる。動きベクトルの集合58は、ビットストリーム・グルーピング78から抽出されて、予測ブロック98に送られる。サブバンド形式(図4(b))になっている復号されて拡大・縮小されたグルーピング差88は、量子化回復ブロック90に与えられる。量子化回復ブロック90において、過去の変換係数及び過去と現在の量子化解除項が量子化された変換係数の値を回復するために用いられる、すなわち、それらはグルーピング差70を再生するために用いられる。
サブバンドの集合92(符号器基準フレーム)が遅延ブロック94に送られる。サブバンドの遅延集合96は、遅延ブロック94から予測ブロック98に送られる。符号器の動き予測ブロック60において実施されたプロセスと同様に、動きベクトルの集合58は、予測ブロック98のサブバンドの遅延集合96に適用される。そこにおいて、サブバンドの遅延集合96は、予測されたグルーピング100(すなわちグルーピング差70を含まない更新された画像のサブバンド表現)を生成するために変更される。グルーピング差70と予測されたグルーピング100は、サブバンドの集合92(すなわち新しい基準フレーム)を生成する加算器ブロック102において加えられる。最後に、逆小波変換がサブバンドの集合92についてブロック104において行われる。このステップは、本質的には簡単に上述した順方向小波変換32の逆であり、本明細書において以下により詳細にする。ブロック104からの結果として生じる出力は、復元された画像105である。
前に説明し、図3及び図4において示したように、QCIF画像30(図4(a))は、各ビデオ・フレームを変換してサブバンドの集合34(図4(b))を形成する順方向小波変換32に送られる。変換ブロック32の実施例は、テンソル積小波変換を利用する。テンソル積小波が変換するの詳細な論議のために、本明細書に参照して取り入れられているジョウエル・ラウジエンヌ(Joel Rosiene)とイアン・グリーンシールド(Ian Greenshields)著、「画像の標準小波基礎圧縮」(Standard Wavelet Basis Compression of Images)、オプチカル・エンジニアリング(Optical Engineering)第33巻、第8号(1994年8月)を参照されたい。周知のMallat、GenLOT又はHarr変換のような他の有限精度変換を利用もできる。そのような適切な代替小波変換の論議のために、本明細書に参照することによって組み入れられているジー・ストラング(G.Strang)及びティー・ニュイアン(T.Nguyen)著、「小波及びフィルタバンク」(Wavelets and Filter Banks)、Wellesley−Cambridge Press(1997)を参照のこと。
図4(b)を参照すると、順方向小波変換32が通過した後のサブバンド34の集合が示されている。前に指摘したように、順方向小波変換プロセスは、テンソル積小波変換又は本明細書において修正された他の周知の有限精密変換を利用して有限精密実働化の効果を減らす。一般に、変換プロセスは、(m+1)x(n+1)サブバンドをつくるためにmxn段階から成るだろう。図6と共同して以下で論ずる一つの実施例において、変換プロセスは合計16のサブバンドを作るために3x3段階から成る。本発明の範囲内にある他の実施例を本明細書において与えられた開示に従って作ることができる。
図6(a)を参照すると、順方向小波変換プロセスがQCIF画像フレーム30を1列ずつベースで3 段階を使用してフィルタする。各段階は、低域フィルタ108と高域フィルタ110を含む。一つの実施例において、各低域フィルタ108は、−1、2、6、2の値を有し、各高域フィルタが−1、2、−1の値を有する。
フィルタした後に、低域通過成分と高域通過成分は、基準化されるか、それぞれ、デシメータ112と114によって各段階で10分の1を取られるか又は抽出数を減らされ、それによって離散信号を含むサンプル値の成分は除去される。例示の実施例において、入力画像は一つおきのサンプルを捨てるために抽出数を半分にされる。20分の1を取ることは、最終的に入力の正確な再生を可能にするために必要にしてかつ十分な変換係数を得ることになる。その後で、低域通過成分と高域通過成分の抽出数を減らされた値は、図7に関して本明細書において以下にさらに詳細に説明する方法で各段階において正規化される。代1段階の出力は、低域フィルタ成分AOR と高域フィルタ成分DORを含む。低域フィルタAORは2回目に分解され、次に、3回目に追加の列詳細D1R及びD2R並びに列平均A2Rを得る。
図6(a)に示された列段階の列出力D0R、D1R、D2RとA2Rは、次に図6(b)に示された段階に行ごとベースで適用される。図6(b)に示される3段階の各々は、図6(a)とともに上で示したのと同じ方法で適用されるフィルタ対、ダウンサンプリング及び正規化プロセスを備えている。変換出力は、図3に関して上述し、図4(b)に図示したようなサブバンドの集合34である。
図4(b)をここで参照すると、識別目的のために、各サブバンドがサブバンド記号SBi,jによって識別される。ここで各列に対してi=0、1、2又は3及び各行に対してj=0、1、2又は3である。影付きサブバンド・ブロック(例えばSBoo内のサブバンド・ブロック116とSB33内のサブバンド・ブロック118)は、図4(a)のQCIF画像30の1MB24に対応する。上述の10分の1の抽出プロセスのために、各対応するサブバンド・ブロックは、例えば、SBooのサブバンド・ブロック116が8×8の係数を含み、SB33のサブバンド・ブロック112が2×2の係数を含むように比例して減らされる。上述のように、関連のサブバンド・ブロック(例えばサブバンド位置2,4にある各サブバンド(SBoo乃至SB33)にあるサブバンド・ブロック)は、若干の処理ステップを容易にするために、ブロック36(図3と5)におけるサブバンド・マクロブロック・パッキングのステップの間に集められる。
図7を次に参照すると、開示された実施例の特徴によればによれば、サブバンド符号化プロセスの各段階の間の残りは、有限精密変換のために導入された誤差を補償するために反対側のフィルタ経路に伝搬される。伝搬された残りは、精度の失われるのを償うように反対側のフィルタ経路で係数を調整するために利用される。このプロセスは、非線形変換に結果としてなる。さらに、フィルタを変更するプロセスは、それらを2直交にも直交にもしない。
図7は、図6(a)に示された列変換の代段階の対向フィルタ・チャネルに残りを伝搬するための実働化を例示している。同様の実働化が列段階と行段階各々に含まれている。入力フレーム30の係数は、通常の方法で低域フィルタ108と高域フィルタ110においてフィルタされる。結果は、それぞれ、サンプラ112と114において減数抽出される。低域フィルタ108の分解された結果は、低域通過正規化出力122と低域通過残りrlを作る低域通過正規化プロセス120において正規化される。高域フィルタ110の分解された結果は、高域通過正規化出力126高域通過残りrhを生成する高域通過正規化プロセス124において正規化される。各正規化プロセス120と124からそれぞれ生じている残りrlとrhは、各々図示されたように関数g(rl,rh)128とf(rl,rh)130を通される。関数g(rl,rh)128の結果は、加算器132において低域通過正規化出力122に加えられてAOR(第1の段階平均)になる。関数f(rl,rh)130の結果は、加算器133において高域通過正規化出力126に加えられてDOR(第1の段階脱落細部)になる。
フィルタL={−1、2、6、2、−1}及びH={−1,2、−1}の場合、残りの関数の一つの実施例が次の通りである。nh=1/2であるf(rl,rh)=floor(rh+1/2)及びg(rl,rh)=rh。残りの上述の操作は各フィルタ対に対して繰り返され、変換出力におけるビット割当が少なくする。
テンソル積小波対の実施例は、次式のものである:
ここで:X2i =入力データ
X2i−1=入力データX2iに先行するX=データ、
X2i+1=入力データX2iに続くデータ、
Di =詳細部項(10分の1を取った高域フィルタ出力)、
Di+1 =詳細部項Diに続く詳細部項、
Ai =近似項(10分の1を取った低域フィルタ出力)。
ここで:X2i =入力データ
X2i−1=入力データX2iに先行するX=データ、
X2i+1=入力データX2iに続くデータ、
Di =詳細部項(10分の1を取った高域フィルタ出力)、
Di+1 =詳細部項Diに続く詳細部項、
Ai =近似項(10分の1を取った低域フィルタ出力)。
テンソル積小波変換の上述の説明は、高域通過(詳細部)と低域通過(近似)成分への2方向分割を示している。それに加えて、その説明は、第1のバンドから第2のバンドへ、第2のバンドから第1のバンドへ、又は、第1のバンドから第2のバンドへと第2のバンドから第2のバンドへの両方向へ伝搬する可能性を示している。上述の実施例は、本発明の基礎概念を示すことを目的として、本発明の有効範囲を制限すると決して解釈されてはならない。
例えばテンソル積小波が3方向分割が高域フィルタ、中域フィルタと低域フィルタを含んでいる第1段階持つことができる。次に、低域フィルタの出力を繰り返すことができる、すなわち、3方向分割を有する第2段階を低域フィルタの出力に適用して合計5サブバンドにすることができる。そのような実施例において、残りを低域フィルタと高域フィルタから中域フィルタへ伝搬させることができるだろう。この実施例は、テンソル積小波変換が変えられてなお、開示された発明の範囲および精神を保ち続けることのできる方法のまさに一例である。当業者は、入力が各段階で分割されて繰返されることのできる多数の他の方法があることとともに、残りがサブバンド間を伝搬させられることができる多数の他の方法があるということを容易に理解するだろう。
それに加えて、残りの伝搬に関する上述の説明は、その使用をテンソル積小波変換に制限することを目的としない。それをいかなる変換とも一緒に使うことができる。例えば、残りの伝搬を離散コサイン変換(DCT)と一緒に使うことができる。また、残りの伝搬を損失なし又は損失の多い方法で使用できる。
本明細書において上述したように、順方向小波変換32の出力は、QCIF画像30の完全な表現又は過完全な表現である可能性がある。QCIF画像30の完全な表現は、画像の内容を表示するのにちょうど十分であるサブバンドの集合を含んでいる。QCIF画像30の過完全表現が、本明細書において後術する動き補償を容易にするために、完全な表現及び冗長、選択的又は付加的なサブバンド表現を含んでいる。各表現は、開示された実施例における値を有する。例えば、過完全表現は、様々な画像変化(例えば並進的動き、回転動き及び拡大縮小)を含むことができる。これらの変化は、動き補償の間、必要に応じて撤回されて、画像変化を表しているという問題を索引手法の一つに縮減することができる。
上述の順方向小波変換に関して、本明細書において例示された変換画像フレーム構造がルマ(luma)成分のためのものであるが、その構造はまたクロマ(chroma)成分に対しても適用できるので、別に記載されていなかったことを特記しておく。
図3に関してより上に本明細書において記載されている変化・検出ブロック46に関して、ゼロの基準又は他の若干の基準(例えば遅延48通して出力される過去の重み付きグルーピング)が重み付きグルーピング44変化量を検出するために用いられてもよい点特記しておく。変化・検出ブロック46の実施例が下記の一般式の変化検出計量(重み付きグルーピング44が適用されることになっている)を含んでいる。
ここで、ec=基準Rに対するゆがみの測定、
Wi=適用した重み、
G =サブバンド変換係数の現在のグルーピング、
及び
R =基準(例えばゼロ又は遅延ブロック48を通して得られたサブバンド係数の前のグルーピング)
変化検出計量が以下のより特殊な形を取ってもよい
Wi=適用した重み、
G =サブバンド変換係数の現在のグルーピング、
及び
R =基準(例えばゼロ又は遅延ブロック48を通して得られたサブバンド係数の前のグルーピング)
変化検出計量が以下のより特殊な形を取ってもよい
なお、変化・検出46は、何かが変化・検出46から出力されるには、ビット割当てに関して、高過ぎると決定されれば、重み付きグルーピング44の若干の重み付きマクロブロックを除去するために、符号化ビットストリーム・グルーピング78からの帰還132(図3)によって与えられる情報を利用できる。さらに、変換検出ブロック46は、それがもう一つの特徴(例えばサブバンド・ブロック)をその特徴をさらによく表すと思われるもう一つのものと取替えることができる。
本明細書において上述され、図3に示されているように、順序付サブバンド・グルーピング53と順序付サブバンド・マクロブロック・グルーピング54は、それぞれ遅延ブロック62と動き評価ブロック56に動き評価のための線55を介して送られる。ブロック56で、比較プロセスが順序付サブバンド・マクロブロック・グルーピング54(すなわち「現在の」フレーム)のサブバンド・ブロックと遅延順序付サブバンド・グルーピング57(すなわち「基準」フレーム)の関連した検索領域との間で実施される。当業者は、現在のフレーム用の順序付サブバンド・マクロブロック・グルーピング54を、そして基準フレーム用の遅延順序付サブバンド・グルーピング57を利用することにある程度の利点を認めるだろう。しかし、本発明の教示を守っている他のグルーピングと組合せを利用できることもまた認められるべきである。ブロック56において実施された比較プロセスは、本明細書において簡単に上述されているように、動き予測のためのブロック60へ及びビットストリーム中に位置的符号化するためのブロック76に送られる動きベクトルの集合58を作る。
図8と9を参照して、ブロック56の動き評価及び動きベクトルの集合58の生成を次にさらに詳しく説明する。図8には、遅延順序付サブバンド・グルーピング57が示されている。遅延順序付サブバンド・グルーピング57は、図4(b)において示されたサブバンドの集合34と同様であるが、ブロック52(図3)において順序付けられたそれのサブバンド・ブロックを持つこと及び遅延ブロック62において少なくとも1フレームだけ遅延させられたことによってさらに処理された。個々の動きベクトルを決定するのを容易にするために、検索領域がサブバンド(SBoo乃至SB33)のうちの少なくとも一つにあるサブバンド・ブロックの周りに定められている。周りに検索領域を定められるように選ばれた各サブバンド内のサブバンド・ブロックは、変化・検出ブロック46において有意として定められたものである。それは、動きベクトルをSBoo内の有意なサブバンド・ブロックに基づいて作り出すのに十分なことが多い。
図8を続けて参照すると、QCIF画像30(図4(a))の画像マクロブロック2,4(1MB2,4)に対応する各サブバンド・ブロックの周りに作り出された検索領域が示されている。検索領域の大きさは、変えられてもよい。しかし、サブバンド・ブロックの周りの検索領域は、それらと画像の分数関係に常に比例するであろう。例えば、136に示されているように、QCIF画像30(図3)のPxPペルの基本検索領域がP/2xP/2のSBoo(図8)のサブバンド・ブロック137の周りの検索領域へ及び139に支持されているようにP/4xP/2のSB01のサブバンド・ブロック140の周りの検索領域へ移動する。
本明細書において以下に与えられる動き評価の例の場合、図13のPxP検索領域107は、32×32ペル(それは16×16ペルを有する1MB2,4の大きさの4倍である)を含むことになっている。したがって、P/2xP/2検索領域136(図8)は、サブバンド・ブロック137(8×8係数)の大きさの4倍である16の×16の係数を含む。そして、P/4xP/2検索領域139は、サブバンド・ブロック140(8×4係数)の大きさの4倍である16×8の係数を含む。本明細書においてさらに後術するように、サブバンド・検索領域は、サブバンド(SB00乃至SB33)のいくつか又は全ての各有意なサブバンド・ブロック(0,0乃至8,10)のための動きベクトルを決定するのを容易にするために用いられる。
検索領域の基準寸法(PxP)は、例えばフレームとの間に予期される動きの量を考慮して、経験的又は統計的解析によって決定できる。また、与えられた検索領域の検索を実施するために必要とされる計算努力を考慮しなければならない。検索領域が大きければ大きいほど、固定プロセッサのためにより多くの計算資源、したがって、より多くのフレーム間遅延を必要とすることが当業者によって容易に理解される。逆に、検索領域が小さければ小さいほど、画質を特性にすることを除いて少ない計算資源でよい。これは、特に高い画像−動き周期の間あてはまる。すなわち、動きの一部分が検索領域の外に位置し、したがって、正確な動きベクトル選択を妨げる可能性があるので、画像の品質は落とされる。
上述のように、順序付サブバンド・グルーピング53と順序付サブバンド・マクロブロック・グルーピング54は、ブロック52からそれぞれ遅延ブロック62と動き評価ブロック56へ線55を通して送られる。本明細書における下記の例の場合、検索領域が遅延順序付サブバンド・グルーピング57(図8)のSBooのサブバンド・ブロック2,4のまわりに配置される。そして、順序付サブバンド・マクロサブバンド・グルーピング54(図5(c)のサブバンド・ブロック116を参照)内のサブバンド・マクロブロック2,4にあるSBooのサブバンド・ブロックが変化するために検索領域を横に動くために用いられる。しかし、上述のように、サブバンドのいかなる選択もすなわちサブバンドの全てを下記の方法に続いて使用してもよい。
図3、8と9を次に参照すると、上述の通り、順序付サブバンド・グルーピング53は、遅延順序付サブバンド・グルーピング57(「基準」フレーム)を生成する遅延62において遅らされる。遅延順序付サブバンド・グルーピング57は、動き評価ブロック56に送られ、そこでは、検索領域136がサブバンド・ブロック137の周りにSBoo内のP/2xP/2領域を有するとして識別されている。この例の場合、検索領域は、16x16係数に等しい。順位付サブバンド・マクロブロック・グルーピング54(「現在の」フレーム)もまた、動き評価ブロック56に送られ、そこでは、図5(c)のサブバンド・ブロック116の影付き領域と同様のサブバンド・ブロック138(図9(a))が後術の比較プロセスにおいて使用するために検索される。
特に図9(a)乃至(d)を次に参照すると、動きベクトル(MVx,x)が図3の動き評価ブロック56において決定されるプロセスが示されている。下記の例において、動きベクトルは一つのサブバンド・ブロック(すなわちSB00のサブバンド・ブロック2,4)に対して決定される。しかし、動きベクトルを各サブバンド(SBoo乃至SB33)の各有意なサブバンド・ブロックのために決定できる。
図9(a)を参照すると、順序付サブバンド・マクロブロック・グルーピング54のサブバンド・ブロック138が遅延順序付サブバンド・グルーピング57(図8)の検索領域136の中にある。サブバンド・ブロック138は、遅延順序付サブバンド・グルーピング57のサブバンド・ブロック137の上にほとんど重ね合わされる。上述のように、順序付サブバンド・マクロブロック・グルーピング54は、図5(c)において示されたサブバンド・マクロブロック・グルーピング40と同様の構造を有する。そして、遅延順序付サブバンド・グルーピング57は、図4(b)に示されたサブバンド34の集合と同様の構造を有する。
図9(a)を再度参照すると、検索領域136の係数141(各々に「x」のついた4つの円として示されている)とサブバンド・ブロック138 の係数142(4つの円として示されている)が動きベクトルを決定する方法を図示するのを容易にするために本明細書において使われる。係数141と142は、値においてほぼ等しいこと及び残りの係数(図示せず)は、係数141と142と異なるが互いにほぼ等しい値のものであることをこの例に対して仮定している。係数141と142の位置の差は、二つのビデオ・フレーム(の間の変化例えば並進的移動)を表している。
図9(b)を参照すると、ブロック138が横に動く、すなわち、予め定めた段階的パターンで検索し、検索領域136は、サブバンド・ブロック138と検索領域136の間の各ステップで総絶対差を決定しようとする。当業者は、種々の横移動パターンを使用できること認めるであろう。なお、総絶対差以外の基準を比較のための基礎として使うことができる。初めの比較は、サブバンド・ブロック138 の増分的又は全ステップ移動を利用して最良の一致を見出そうとする。増分的移動がx又はy方向どちらかにおいて、全シフト又はステップである。例えば、検索領域136全体を検索する際に、サブバンド・ブロック138はx方向に±4増分、すなわち、変換係数、だけ及びy方向で±4増分だけ検索領域136内でシフトする。サブバンド・ブロック138が8×8係数を有し、一方検索領域136が16×16係数を有するので、サブバンド・ブロック138は、xとy方向に±4増分をシフトする。
図9(b)を続けて参照すると、増分的検索を行った後に、最良の一致が、正のx方向に3全増分移動と正のy方向に2全増分移動であると分かる。その後で、図9(c)に見られるように、分数差がサブバンド・ブロック138と検索領域136の間の差をより正確に表すために決定される。このプロセスを容易にするために、特定のサブバンドに適当な分数の動きを表すマスクがサブバンド・ブロック138に適用される。
例えば、SBooは、元の画像(図4(a)の1MB2,4を参照のこと)にある関連したマクロブロックの大きさの1/4なので、サブバンド・ブロック138が1MB2,4のより細かい動きをより正確に再生させることができる4分数移動がある。すなわち、サブバンド・ブロック138は、x方向の増分の±1/2とy方向の増分の±1/2を動かすことができる。したがって、四つの分数マスク143は、最良の一致を捜してサブバンド・ブロック138を変更するために用いられる。
図9(c)の参照を続けると、四つのマスク143は、サブバンド・ブロック138に適用される。各マスクの適用の間に、サブバンド・ブロック138と検索領域136にある係数間の総絶対差は決定される。より良い一致が見出されれば、上記の増分検索の間に決定されたものと比較して、分数マスクは、動きベクトルに加算される。この例において、最良の一致は、正のx方向に+1/2の分数動きであると決定される。動きベクトルの結果として生じるxとy成分は、それぞれ+3・1/2と+2である。当業者は、上述の例において示したのと同程度に正確な一致を得ることは普通でないと認めるであろう。この意味で、サブバンド・ブロックの係数と検索領域の係数との間の「最良一致」は、二つの間の「最も近い近似」としてより正確に記載されることがある。動き予測は、このような精度の不足を補償するために後で用いられる。
図9(d)を参照すると、動きベクトルのxとy成分は、それの符号に逆にされて拡大・縮小される。さらに詳しくは、xとy成分の各々に−1を掛けること、及びSBooが動き評価の為に使われているこの例においては、xとy成分の各々に2を掛けることである。xとy成分の符号は、動きベクトルが動き予測(更に詳細に以下に論じる)の間、遅延順序付サブバンド・グルーピング57に適用されるとき、適当な係数が「前の」フレーム位置から「現在の」フレーム位置へ動かされるように逆にされる。そして、xとy成分は、元のQCIF画像(1MB2,4)の関連マクロブロックに関して、上で決定された移動(x=3・1/2(y=2))を表すために拡大される。拡大・縮小することは、動き予測の間、サブバンドSBoo乃至SB33における適当な係数をシフトする際に使用されるxとy成分の決定をより簡単にできるようにする。
この例において、SMB2,4内のサブバンド・ブロックの動きを識別している結果として生じる動きベクトルは、x=−7とy=−4(MV2,4)である。MV2,4は、動きベクトルの集合58を記憶される。MV2,4は、したがって、遅延順序付サブバンド・グルーピング57(「基準」フレーム)の各サブバンドからの係数の若干の集合順序付サブバンド・グルーピング53(「現在の」フレーム)を予測するためのそれらの新しい位置への移動を表している。上記のプロセスは、例えば、SBooの各有意なサブバンド・ブロックに対して繰り返される。処理は、一般的にランキング順で、すなわち、最大量の移動を有するマクロブロックから最小量の移動、を有するものへ進む。完全に無意味なサブバンド・ブロックは、全く考えられないので、動きベクトルを割り当てられないだろう。これは、例えば、フレーム間の位置における変化が無意味又は無いときに起こるだろう。サブバンド・ブロックが、本明細書において上述のように、ゼロと照合されたときにもそれは起こる可能性がある。
異なるサブバンドを動きベクトルを計算するために用いるべき場合、増分的動き及び分数動きは、QCIF画像30に関して特定のサブバンドの比例関係を使用して上述のものと類似の方法で決定されるだろう。例えば、SB01のサブバンド・ブロックが動きベクトルを作り出すために用いられる場合、以下の基準を適用する。領域サイズ=16×8係数、x分数のマスク=1/4、±1/2及び±3/4増分、y分数のマスク=±1/2増分、xスケーリング=4、及びyスケーリング=2
上記の方法を使用する利点は、その分離できるフィルタを使用できるということである。換言すれば、一つのサブバンド・ブロックの増分及び分数移動のために使用するフィルタをもう一つのサブバンド・ブロックの増分及び分数のために使用できる。例えば、SBooのサブバンド・ブロックは、x=±1/2及びy=±1/2の四つの可能な分数移動を有する。そして、SB01のサブバンド・ブロックは、x=±1/4、±1/2と±3/4及びy=±1/2の可能な分数移動を有する。SBooとSB01におけるx=±1/2及びy=±1/2の共通分数移動のため、単一の分離できるフィルタを両方のサブバンドにおけるx=+1/2、x=−1/2,y=+1/2及びy=−1/2の分数移動のために使用できる。この方法を遅延順序付サブバンド・グルーピング57にある全ての共通の分数移動に使用できる。分離できるフィルタの同じ有利な使用法を動き予測ブロック60において実施できる。
図10を参照すると、全ての有意なサブバンド・ブロックが動き評価ブロック56において処理されたあと、動きブロックの集合58は、動き予測ブロック60と位置的符号化ブロック76に出力される。動き予測ブロック60において、動きベクトルは、係数のある数の集合の遅延順序付サブバンド・グルーピング57(「基準」フレーム)の各サブバンドから順序付サブバンド・グルーピング53(「現在の」フレーム)を予測するためのそれらの新しい位置へのシフトを計算するために用いられる。
そのようなシフトを生成するためにどのマスクを使用するべきかについて決定するために、xとy成分は、各サブバンド・ブロックの対応するモジュロの逆数を掛けられる。例えば、SBooの2,4位置に動いたと決定された係数148の8×8集合をシフトするためのxとy成分を決定するために、MV2,4のxとy成分は、各々対応するモジュロ2の逆数を掛けられる。この計算結果は、x=−31/2とy=−2になる。したがって、x=−3の増分移動用マスク、x=−1/2の分数移動用マスク、及びy=−2の増分移動用マスクが8×8係数148に適用される。
第2の例として、SB01の2,4位置に動いて決定された係数149の8×4集合をシフトするためのxとy成分を決定するために、MV2,4のx成分はモジュロ4の逆数を掛けられ、MV2,4のy成分はモジュロ2の逆数を掛けられる。この計算結果は、x=−1・3/4及びy=−2になる。したがって、x=−1の増分移動用マスク、x=−3/4の分数の移動用マスク及びy=−2の増分移動用マスクが適用される。
図10は、係数の全集合のSMB2,4に対応するサブバンド・ブロックへの移動を示す。動きベクトル58の集合からの動きベクトル(MVx,x)を遅延順序付サブバンド・グルーピング57(「基準」フレーム)に適用すると順序付サブバンド・グルーピング53(「現在の」フレーム)の予測が得られ、予測されたグルーピング66(図3)という。
フレーム間の分数移動を決定するための上述のマスキング・プロセスの代替実施例が3×3係数マスクを使用することを含んでいる。これらのマスクは、選択された係数を囲んでいる係数の重み付き平均を取る。代替方法において、増分移動だけを含む動きベクトル58の集合が各サブバンド(SBoo乃至SB33)又は選択数のサブバンド(例えばSBooだけ)にある各有意なサブバンド・ブロックに対して上述し図9(a)と9(b)に示されたように決定される。動きベクトル58の集合は、動き予測ブロック60に送られる。
動き予測ブロック60において、動きベクトル58の集合は、図10において図で示されたものに類似している方法で適用され、遅延順序付サブバンド・グルーピング57の有意なサブバンド・ブロックを増分的にシフトさせる。その後で、係数の各シフトされた集合の各係数は、3×3マスクをそれに適用される。適用されるマスクは、各シフトされた係数を囲んでいる係数の重み付き平均を決定する。その計算の結果は、シフトされた係数の予測すなわち係数の新しい値である。
動きベクトル58の集合からの動きベクトルの全てが遅延順序付サブバンド・グルーピング57に適用されて、動きベクトルによってシフトされた係数の全てがそれらに3×3マスクを適用された後に、結果は、予測されたグルーピング66としての動き予測ブロック60から出力される。もちろん、このプロセスは、動き予測ブロック60において行われたマスキング・プロセスを模写するために復号器82の予測ブロック98において繰り返される。
予測が上述の方法のどちらかによって決定された後で、予測されたグルーピング66が順序付サブバンド・グルーピング53と予測されたグルーピング66の間の差が決定される差ブロック68に渡される。上述の通りに、差ブロック68は、グルーピング差70を生成する。
本明細書において記載された動き補償法がテンソル積小波と連動して機能するとして例示されているが、その方法を他の形式の変換とともに利用できることを特記しておくことは重要である。これは、動き補償法を時間領域又は変換ドメインのいずれかにおける他の変換とともに利用することを含む。例えば、DCTにおいて変換されたデータを上述したものと同様の方法で動き補正できる。すなわち、DCTの8×8ブロックの各々にある64の変換係数は、テンソル積小波のSBooの8×8サブバンド・ブロックの各々にある64の変換係数を動き補正するために使用されたものと同様の方法で動き補正できる。
図11を次に参照すると、ビデオ符号器のもう一つの実施例が示されている。上述され図3において示された実施例におけるように、動き評価と動き予測が、それぞれ、ブロック150と152の変換ドメインにおいて行われる。また、実施例の前部分は、上述し図3において示したものと同様である。さらに具体的にいえば、CIF画像26は、コンバータ28においてQCIF画像30に変換される。QCIF画像30は、変換して、マッピング成分20を特徴づける画像によってサブバンド・マクロブロック・グルーピング40にコンバートされる。そして、サブバンド34の集合とサブバンド・マクロブロック・グルーピング40は、それぞれ、22を変更した特徴を決定することと関連した成分によって、順序付けされたサブバンド・グルーピング53と順序付けされたサブバンド・マクロブロック・グルーピング54に変換される。
また、順序付サブバンド・マクロブロック・グルーピング54が動き評価ブロック150へ送られ、順序付サブバンド・グルーピング53が差ブロック68に送られることは、図3において示された実施例と同様である。しかし、基準枠として遅延順序付サブバンド・グルーピング57を利用する代わりに、累積誤差をそれに加えられた、誤差修正済みサブバンド・グルーピング171が遅延ブロック156に送られ、それによって、遅延サブバンド・グルーピング172(「基準」フレーム)を生成する。量子化(又は拡大・縮小)が差ブロック68において生成された予測誤差70をいちじるしく変更するほど大きいとき、そのような変形が必要である。
誤差修正サブバンド・グルーピング171を作り出すために、システムがゼロに照合されるときに、例えば、システムが始められるとき又は復号器の基準がリフレッシュされるべきとき、1部の順序付サブバンド・グルーピング53が差ブロック68を無変化で通されて、メモリに記憶される。その後で、次の各フレームの予測誤差70が量子化ブロック158を通過するので、予測誤差70は累算される、すなわち、基準に加えられる。更新された基準画像は、遅延ブロック156に送られ、それによって、遅延サブバンド・グルーピング172を生成する。この方法を利用することによって、符号器の基準は、復号器の基準と同期したままになる。当業者は、かなりの量の拡大・縮小及び/又は量子化が、動き予測と位置的符号化の間に行われるとき、そのような構成が符号器と復号器の間の同期を維持する際に有効であることを認めるであろう。
動き評価ブロック150と動き予測ブロック152が遅延ブロック156から遅延サブバンド・グルーピング172を受けたあと、動き評価と動き予測は本明細書において上述されたものと同様の手続によって決定されて、図8乃至10において図で示される。なお、順方向送り159は、変化検出46と量子化ブロック158の間に設けられて、ブロックが変化した量に従い、特定のブロックに行われることになっている量子化の量を調整する。多量の変化が変化検出46に認められるときに、多数のビットが量子化ために割り当てられる。そして、逆に、少量の変化が変化検出46に認められるときには、比例してより小数のビットが量子化のために割り当てられる。
図12を次に参照すると、ビデオ符号器のもう一つの実施例がなお示されている。この実施例の前部分は、上述し、図3と11に図示した実施例と同様である。しかし、上述の実施例とは異なり、動き評価が画像ドメインにおいて実施されている。この実施例は、若干のプロセッサに現在利用できる特殊なハードウェア配置を利用している。
図12において、CIF画像26がコンバータ・ブロック28内でQCIF画像30に変換される。QCIF画像30は、変換されて、マッピング構成要素20を特徴づける画像によってサブバンド・マクロブロック・グルーピング40に、コンバートされる。サブバンド・マクロブロック・グルーピング40は、サブバンド・マクロブロック・ランキングを決定するように変えられた構成要素22を有する特徴を決定することと関連する構成要素によって処理される。その結果は、サブバンド34の集合に適用されて順序付サブバンド・グルーピング53になる。その後で、順位付サブバンド・グルーピング53が差ブロック68に送られる。QCIF画像30(また、「現在の」フレームと称する)は、また、動き評価ブロック160と動きベクトル162の集合を決定するための遅延ブロック166に送られる。さらに具体的にいえば、画像フレーム30は、遅延画像フレーム167(また、「基準」フレームと称する)を生成する遅延ブロック166において遅らされる。図13を参照すると、遅延画像フレーム167は、PxPペル検索領域が各有意な画像マクロブロックのまわりに創り出される動き評価ブロック160に送られる。例えば、PxPペル検索領域107が画像マクロブロック2,4(1MB2,4)のまわりに設定される。経験的解析に基づいて、32×32のペルの検索領域107が、QCIF画像フレームの16×16ペル画像マクロブロックのまわりに検索領域として使われる。
動き評価ブロック160において、現在のQCIF画像30のフレームの各有意な画像マクロブロック(IMBx,x)は、動きベクトルを決定するための遅延画像フレーム167の対応する検索領域内にある。例えば、1MB2,4は、QCIF画像30から検索されて、遅延画像フレーム167の検索領域107の中に置かれる。このプロセスは、図8と9(a)において上述し図で示したような変換ドメインにおいて実施されたものと類似している。
図9(b)において上述し、図で示したものに類似している方法で、1MB2,4は、1MB2,4と検索領域107の間の各ステップでの最小総絶対差を決定しようとしている検索領域107を横に移動する。しかし、上述のサブバンド検索とは異なり、検索が画像ドメインの中にあるとき、分数検索は不必要である。したがって、1MB2,4の増分動きを決定した後に、x及びy座標は、逆にされ(−1を掛けられて)て、動きベクトル162の集合をメモリに記憶される。動きベクトルは、動き予測ブロック154及び位置的符号化ブロック76に送られる。その後で、動きベクトルは、図3及び11に関して上述され図10において示されたものと同様の方法で遅延サブバンド・グルーピング172に適用される。
図14を次に参照すると、ビデオ・符号器のもう一つの実施例が示され、その図において、前部分は、上述され図3、11及び12において例示された実施例と同様である。しかし、上述の実施例とは異なり、動き評価及び動き予測は、画像ドメインにおいて実施される。
図14において、動きベクトルの集合162が上述され図12及び13において例示されたものと同様の方法で決定される。動きベクトル集合162は、動き予測のためのブロック164及び位置的符号化のためのブロック76に送られる。上述され図11及び12において例示されたものと同様の方法で、累積誤差を加えられた誤差修正サブバンド・グルーピング171は、遅延ブロック156に送られ、それによって、遅延サブバンド・グルーピング172(「基準フレーム」)を生成する。しかし、上述の実施例とは異なり、遅延サブバンド・グルーピング172は、それから逆小波変換ブロック174によって復元されて、復元された画像176を形成する。復元された画像は、図4(a)に示されたQCIF画像30と同様の構成を有する。
代わりに、遅延サブバンド・グルーピング172をその全体を復元する代わりに、グルーピングの一部分を復元しての率を上げることができる。例えば、3、5のフィルタを用いて48×48ペルを有する復元された領域を得ることができる。いくつもの領域が、周りにそれらの領域が集められている画像マクロブロック(16×16)の重要性(すなわち、それらの領域の中で検出された変化)に基づいて選ばれる。
動き予測ブロック164において、動きベクトルの集合162が復元された画像176(又は、数領域だけが逆数小波変換されたとすれば、復元された48×48ペル領域)に適用される。動きベクトル162の集合は、QCIF画像のサブバンド表現における変換係数の集合をシフトするために上述され図10において例示されたものと同様の方法で復元された基準画像176に適用される。その後で、予測178が予測されたグルーピング66を生成する順方向小波変換ブロック180に送られる。予測されたグルーピング66は、それから差ブロック68における順序付サブバンド・グルーピング53から引かれて、グルーピング差70になる。量子化がブロック158において実施され、誤差は基準(上記の通りの)を維持するために累算されるとともに、位置的符号化ブロック76に前送りされる。量子化された誤差及び動きベクトル162の位置的符号化が上述のように起こり、伝送線80を通して復号器に転送される。
ソフトウェア実動化として本明細書において例示されたが、本発明の実施例の原理はまた、特定用途向け集積回路(ASIC)によって、ハードウェアにおいて実現できるであろう。なるべくなら、必要なメモリ必要条件を含めて、ASIC実動化は、(i)実施例と整合した電力消費を最小にするため、及び(ii)13.5MHz未満のデータレートでフルカラー・ビデオ(例えば全CCIR601)の圧縮を可能にするためのペル・レートで動作する必要がある。電力消費が従来のソフトウェアとプロセッサ実動化と比較して、ASICを利用することによって10倍のファクタだけ減らされることが見込まれる。
代わりに、光学的方法を電力をさらに削減するように使用できる。上記の通りに、画像への近似が小波変換の各段階でつくられ、そして、この近似を作ることによって失われた詳細部は記録される。光電子的又は光学的実動化において、光が集められて関連の電荷が検出される方法を近似画像のサンプルの各々を集めるように調整できる。これらの近似画像が並列に一緒に重ね合わされる場合、詳細項はアナログ又はディジタルのどちらかの手段によってこれらの中間値から計算できる。なるべくなら、アナログ手段が詳細項をアナログ段階の出力として計算するために用いられるのがよい。
詳細項は、量子化方策を実行するビット直列のアナログー デジタル変換器の使用によって量子化できる。結果として生じるビットストリームは、圧縮される。このようにして、光子/光デバイスは、画像データレート(ASICの場合のように)又はプロセッサ・データレート(従来のプロセッサの場合のように)でではなく圧縮データレートで動作する。これはごくわずかな電流しか消費しないので、電力の必要量の少ない実動化をもたらすであろう。光学的方法の実動化が電力消費をASIC実動化のもののほぼ10倍のファクタだけさらに減らすだろうと見込まれる。
本明細書において図示され説明された実施例と変化形態が単に本発明の原理を例示するだけであり、その種々の変更態様は本発明の範囲と精神から逸れることなく当業者が実現できることを理解すべきである。
以下の図面を参照して本発明の代表的実施例について詳細に説明する。
動き補償が画像ドメインにおいて実施される離散的コサイン変換(DCT)を使用している従来技術標準ビデオ圧縮方法の略ブロック図である。
変換ドメインにおいて実施される動き補償のための機能を含んでいる本発明の実施例の一般構成を図示している略ブロック図である。
図2において図示された実施例のより詳細な構成の略ブロック図である。
画像マクロブロック(IMBx,x)0、0乃至8、10を有するQCIF画像を示す。
画像フレームが順方向小波変換によって変換されたあとのQCIF画像のサブバンド表現を示す。
図4(b)において図示されたQCIF画像のサブバンド表現を示す。
図5(a)において図示されたサブバンド表現から生成されたサブバンド・マクロブロック(SMBx、x)の集合を示す。
サブバンド・マクロブロック(SMBx,x)が図4(a)のそれらの関連画像マクロブロック(IMBx、x)と空間的に対応するように図5(b)のサブバンド・マクロブロックの編成を示す。
入力画像を変換して、10分の1を取るためのフィルタバンク及び各フィルタバンクから作られるそれらのそれぞれの垂直及び水平サブバンドを図で示している略ブロック図である。
入力画像を変換して、10分の1を取るためのフィルタバンク及び各フィルタバンクから作られるそれらのそれぞれの垂直及び水平サブバンドを図で示している略ブロック図である。
フィルタバンクにおける有限精密計算を広帯域から低帯域まで及び逆に低帯域から高帯域まで移すためのアーキテクチャを示す。
検索バンドがPxPペルであり、さらに、入力画像の大きさがQCIFであるときに、SB00の検索バンドに対する検索領域を詳述する画像ドメインにおける画像マクロブロック2,4(1MB2,4)に対応する各サブバンド(SBij)のための変換ドメイン内の検索領域を示す。
動きが変換ドメインにおいて評価される方法を示す。
動きが変換ドメインにおいて予測される方法を示す。
図2において示された実施例の詳細なもう一つの構成を図で示している略ブロック図である。
動き評価が画像ドメインにおいて実施され、動き予測が変換ドメインにおいて実施されている本発明の詳細なもう一つの実施例を示している略ブロック図である。
入力大きさがQCIFであるとき、画像マクロブロック2,4(1MB2,4)の周りの画像ドメインにおいて検索するときのP×Pペル検索領域を示す。
動き評価と動き予測が画像ドメインにおいて実施される本発明の詳細なもう一つの実施例を図で示している略ブロック図である。
Claims (12)
- 少なくとも二つのフィルタ経路を有するテンソル積ウエーブレットを利用して一つのデータセットを変換すること、及び変換の間に誘導された残りをフィルタ経路中の少なくとも二つの間で伝搬させることを含むデータセットを変換係数に変換する方法。
- 少なくとも二つのフィルタ経路の第1フィルタ経路から残りが少なくとも二つのフィルタ経路の第2フィルタ経路からの残りが第1フィルタ経路に伝搬される請求項1に記載のデータセットを変換係数に変換する方法。
- テンソル積ウエーブレット変換が高域通過成分及び低域通過成分を決定するためのテンソル積ウエーブレット対である請求項1に記載のデータセットを変換係数に変換する方法。
- データセットの変換及びフィルタ経路間の残りの伝搬がデータセットの低域通過成分及び高域通過成分を決定すること、低域通過正規化出力及び第1の残り(rl)を生成するために低域通過成分を正規化すること、高域通過正規化出力及び第2の残り(rh)を生成するために高域通過成分を正規化すること、第1及び第2の残りに第1の演算(g(rl,rh))を実行して、近似を生成するために、そこから出る結果を低域通過正規化出力に加えること、及び第1及び第2の残り(rl,rh)に第2の演算(f(rl,rh))を実行して、詳細を生成するために、そこから出る結果を高域通過正規化出力に加えることを含む請求項3に記載のデータセットを変換係数に変換する方法。
- 低域通過成分及び高域通過成分をダウンサンプルすることを更に備える請求項4に記載のデータセットを変換係数に変換する方法。
- 低域通過成分は、値−1,2,6,2,−1を有するフィルタを利用して決定され、高域通過成分は、値−1,2、−1を有するフィルタを利用して決定され、及び以下の関数
a(rl,rh)=rh
及び
f(rl,rh)=floor(rh+1/2)、ここでnh=1/2
を有する第1の演算(g(rl,rh))及び(f(rl,rh))を備える請求項3に記載のデータセットを変換係数に変換する方法。 - 符号化技術を利用してデータセットを変換すること及び符号化の間に誘導された残りをエンコーダの第1のフィルタ経路へ伝搬させることを備えるデータセットを変換係数に符号化する方法。
- 残りを第2のフィルタ経路から第1のフィルタ経路へ伝搬することを更に備えている請求項8に記載のデータセットを変換系ルウに符号化する方法。
- 符号化技術がテンソル積ウエーブレット変換である請求項8に記載のデータセットを変換係数に符号化する方法。
- 符号化技術が離散的コサイン変換である請求項8に記載のデータセットを変換係数に符号化する方法。
- 第1のフィルタ経路におけるデータセットの第1のフィルタ成分を決定すること、第2のフィルタ経路におけるデータセットの第2のフィルタ成分を決定すること、正規化出力及び残りを生成するために第1のフィルタ成分を正規化すること、及び第2のフィルタ経路へ伝搬することを備えるデータセットを変換係数に符号化する方法。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US6663897P | 1997-11-14 | 1997-11-14 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000521650A Division JP4675477B2 (ja) | 1997-11-14 | 1998-11-13 | ビデオ情報圧縮装置と方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008289132A true JP2008289132A (ja) | 2008-11-27 |
Family
ID=22070754
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000521650A Expired - Fee Related JP4675477B2 (ja) | 1997-11-14 | 1998-11-13 | ビデオ情報圧縮装置と方法 |
JP2008096670A Pending JP2008289132A (ja) | 1997-11-14 | 2008-04-03 | データセットを変換係数に変換する方法 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000521650A Expired - Fee Related JP4675477B2 (ja) | 1997-11-14 | 1998-11-13 | ビデオ情報圧縮装置と方法 |
Country Status (7)
Country | Link |
---|---|
EP (1) | EP1031238A4 (ja) |
JP (2) | JP4675477B2 (ja) |
KR (1) | KR100614522B1 (ja) |
CN (1) | CN1190084C (ja) |
AU (1) | AU752219B2 (ja) |
CA (1) | CA2310602C (ja) |
WO (1) | WO1999026418A1 (ja) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE69901525T2 (de) * | 1998-02-13 | 2003-01-09 | Koninklijke Philips Electronics N.V., Eindhoven | Verfahren und vorrichtung zur videokodierung |
FR2813486B1 (fr) * | 2000-08-31 | 2003-01-24 | Canon Kk | Procede et dispositif de transformation de donnees |
KR100366382B1 (ko) * | 2001-02-12 | 2002-12-31 | (주) 멀티비아 | 동영상 부호화 장치 및 방법 |
FI111592B (fi) * | 2001-09-06 | 2003-08-15 | Oulun Yliopisto | Menetelmä ja laite peräkkäisten kuvien koodaamiseksi |
KR100440567B1 (ko) * | 2001-11-06 | 2004-07-21 | 한국전자통신연구원 | 움직임 탐색을 위한 이진 평면 구성방법 및 이를 이용한움직임 추정 장치 |
KR100472476B1 (ko) * | 2002-08-31 | 2005-03-10 | 삼성전자주식회사 | 움직임 보상을 위한 보간 방법 및 그 장치 |
KR100612849B1 (ko) * | 2003-07-18 | 2006-08-14 | 삼성전자주식회사 | 영상 부호화 및 복호화 장치 및 방법 |
JP4556124B2 (ja) * | 2005-02-04 | 2010-10-06 | ソニー株式会社 | 符号化装置および方法、復号装置および方法、画像処理システム、記録媒体、並びにプログラム |
KR100664550B1 (ko) * | 2005-11-02 | 2007-01-03 | 엠텍비젼 주식회사 | 인코딩된 데이터 전달 방법 및 그 방법을 수행하는 촬상장치 |
KR100788983B1 (ko) * | 2005-11-02 | 2007-12-27 | 엠텍비젼 주식회사 | 인코딩된 데이터 전달 방법 및 그 방법을 수행하는 촬상장치 |
KR101277713B1 (ko) * | 2007-02-08 | 2013-06-24 | 삼성전자주식회사 | 비디오 부호화 장치 및 그 방법 |
US8774283B2 (en) * | 2007-03-30 | 2014-07-08 | Sony Corporation | Information processing device and method |
KR101279573B1 (ko) * | 2008-10-31 | 2013-06-27 | 에스케이텔레콤 주식회사 | 움직임 벡터 부호화 방법 및 장치와 그를 이용한 영상 부호화/복호화 방법 및 장치 |
US20120075346A1 (en) * | 2010-09-29 | 2012-03-29 | Microsoft Corporation | Low Complexity Method For Motion Compensation Of DWT Based Systems |
CN106688229B (zh) * | 2014-05-30 | 2019-09-03 | 陈仕东 | 基于变换域传输高清视频的方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5808683A (en) * | 1995-10-26 | 1998-09-15 | Sony Corporation | Subband image coding and decoding |
US5777678A (en) * | 1995-10-26 | 1998-07-07 | Sony Corporation | Predictive sub-band video coding and decoding using motion compensation |
US5764814A (en) * | 1996-03-22 | 1998-06-09 | Microsoft Corporation | Representation and encoding of general arbitrary shapes |
-
1998
- 1998-11-13 JP JP2000521650A patent/JP4675477B2/ja not_active Expired - Fee Related
- 1998-11-13 WO PCT/US1998/024189 patent/WO1999026418A1/en active IP Right Grant
- 1998-11-13 CA CA002310602A patent/CA2310602C/en not_active Expired - Fee Related
- 1998-11-13 EP EP98958556A patent/EP1031238A4/en not_active Withdrawn
- 1998-11-13 CN CNB988119668A patent/CN1190084C/zh not_active Expired - Fee Related
- 1998-11-13 KR KR1020007005298A patent/KR100614522B1/ko not_active IP Right Cessation
- 1998-11-13 AU AU14577/99A patent/AU752219B2/en not_active Ceased
-
2008
- 2008-04-03 JP JP2008096670A patent/JP2008289132A/ja active Pending
Also Published As
Publication number | Publication date |
---|---|
EP1031238A4 (en) | 2003-05-07 |
CN1190084C (zh) | 2005-02-16 |
KR20010032113A (ko) | 2001-04-16 |
KR100614522B1 (ko) | 2006-08-22 |
AU1457799A (en) | 1999-06-07 |
JP2001523928A (ja) | 2001-11-27 |
AU752219B2 (en) | 2002-09-12 |
JP4675477B2 (ja) | 2011-04-20 |
CA2310602C (en) | 2009-05-19 |
CN1281618A (zh) | 2001-01-24 |
CA2310602A1 (en) | 1999-05-27 |
EP1031238A1 (en) | 2000-08-30 |
WO1999026418A1 (en) | 1999-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2008289132A (ja) | データセットを変換係数に変換する方法 | |
US7680191B2 (en) | Apparatus and method for compressing video information | |
JP4409276B2 (ja) | 多重解像度映像表示の方法及び映像符号器 | |
JP4429968B2 (ja) | Svcの圧縮率を高めるシステムおよび方法 | |
JP2006503518A (ja) | 高度にスケーラブルな3次元オーバコンプリート・ウェーブレット・ビデオ符号化 | |
KR20040106417A (ko) | 다중 참조 프레임들에 기초하여 움직임 보상 시간필터링을 사용하는 스케일링 가능 웨이블릿 기반 코딩 | |
KR20050028019A (ko) | 하나 및 다수의 기준 프레임을 기반으로 한 움직임 보상필터링을 사용한 웨이블릿 기반 코딩 | |
JP2006521039A (ja) | オーバコンプリートウェーブレット展開での動き補償時間フィルタリングを使用した3次元ウェーブレットビデオ符号化 | |
US7242717B2 (en) | Wavelet domain motion compensation system | |
TW420955B (en) | Image compression | |
CN1578403A (zh) | 用于视频噪声抑制的方法和装置 | |
KR100643269B1 (ko) | Roi를 지원하는 영상 코딩 방법 및 장치 | |
AU2003217767A1 (en) | Methods for real-time software video/audio compression, transmission, decompression and display | |
JP3759537B2 (ja) | 画像信号伝送装置及び画像信号伝送方法 | |
KR20040106418A (ko) | 웨이브렛 부호화에 대한 다중 기준 프레임들에 기초한움직임 보상 시간 필터링 | |
KR20050049517A (ko) | 웨이블릿 기반의 부호화에서 운동 보상된 시간적 필터링을위한 필터링된 영역과 비필터링된 영역 모두를 갖는엘-프레임 | |
WO2007027012A1 (en) | Video coding method and apparatus for reducing mismatch between encoder and decoder | |
KR20030010983A (ko) | 운동객체기반에서의 움직임 예측 웨이브렛 동영상 압축 및복원장치 | |
KR0185845B1 (ko) | 웨이브렛 변환기를 이용한 계층 부호화기 | |
CN1568011A (zh) | 一种基于运动联合图像专家组的图像帧间增强方法 | |
Chakrabarti et al. | Introduction to scalable image and video coding | |
Anandan et al. | VIDEO COMPRESSION USING ARPS AND FAST DISCRETE CURVELET TRANSFORM FOR MOBILE DEVICES | |
Wang | Fully scalable video coding using redundant-wavelet multihypothesis and motion-compensated temporal filtering | |
KR0178204B1 (ko) | 대역별 특성을 고려한 패턴 벡터 부호화 시스템 및 그 부호화방법 | |
JP2000295622A (ja) | 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置及びそれらのプログラムを記憶した記憶媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20110524 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20111025 |