JP4874642B2 - ロッシーおよびロスレス2dデータ圧縮のための可逆な変換 - Google Patents

ロッシーおよびロスレス2dデータ圧縮のための可逆な変換 Download PDF

Info

Publication number
JP4874642B2
JP4874642B2 JP2005364034A JP2005364034A JP4874642B2 JP 4874642 B2 JP4874642 B2 JP 4874642B2 JP 2005364034 A JP2005364034 A JP 2005364034A JP 2005364034 A JP2005364034 A JP 2005364034A JP 4874642 B2 JP4874642 B2 JP 4874642B2
Authority
JP
Japan
Prior art keywords
column
row
transform
block
values
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005364034A
Other languages
English (en)
Other versions
JP2006197572A (ja
Inventor
スリニバサン サリドハー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2006197572A publication Critical patent/JP2006197572A/ja
Application granted granted Critical
Publication of JP4874642B2 publication Critical patent/JP4874642B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/14Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
    • G06F17/147Discrete orthonormal transforms, e.g. discrete cosine transform, discrete sine transform, and variations therefrom, e.g. modified discrete cosine transform, integer transforms approximating the discrete cosine transform
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03MCODING; DECODING; CODE CONVERSION IN GENERAL
    • H03M7/00Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
    • H03M7/30Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/635Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by filter definition or implementation details

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Multimedia (AREA)
  • Pure & Applied Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Computational Mathematics (AREA)
  • Signal Processing (AREA)
  • Algebra (AREA)
  • General Engineering & Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Complex Calculations (AREA)

Description

本発明は、一般には、ブロック変換に基づくデジタル媒体(block transform−based digital media)(例えば、ビデオおよびイメージ)圧縮に関し、より詳細には、ロッシーおよびロスレス2Dデータ圧縮のための可逆な変換に関する。
(ブロック変換に基づく符号化)
変換符号化は、多くのオーディオ、イメージ、およびビデオ圧縮システムにおいて使用される圧縮手法である。未圧縮デジタルイメージおよびビデオは、通常、二次元(2D)グリッドとして配列されたイメージまたはビデオフレームの位置における画素または色のサンプルとして表されるか、または取り込まれる。これは、イメージまたはビデオの空間領域表現(spatial−domain representation)と呼ばれる。例えば、通常のイメージの形式は、グリッドとして配列された24ビットカラー画素サンプルのストリームである。それぞれのサンプルは、RGB、または特にYIQなどの色空間内のグリッドにおけるピクセル位置の色成分を表す数である。さまざまなイメージおよびビデオシステムは、サンプリングのさまざまな異なる色、空間、および時間の分解能を使用することができる。同様に、デジタルオーディオは、通常、時間サンプリングされたオーディオ信号ストリームとして表される。例えば、典型的なオーディオ形式は、規則正しい時間間隔で抽出したオーディオ信号の16ビット振幅サンプルのストリームからなる。
未圧縮デジタルオーディオ、イメージ、およびビデオ信号は、記憶領域および伝送容量をかなり消費する可能性がある。変換符号化では、信号の空間領域表現を周波数領域(または他の類似の変換領域)表現に変換し、続いて変換領域表現のいくつかの一般的にあまり目立たない周波数成分の分解能を下げることにより、デジタルオーディオ、イメージおよびビデオのサイズを縮小する。この方法では、一般的に、空間領域内のイメージまたはビデオの色または空間分解能、または時間領域内のオーディオの空間分解能を落とす方法と比較して、デジタル信号に目立った劣化があまり生じない。
より具体的には、図1に示されている典型的なブロック変換符に基づくコーデック100では、未圧縮デジタルイメージのピクセルを、それぞれのブロックが場合によっては他のブロックとオーバーラップする固定サイズの複数の二次元ブロック(X、...X)に分割する。空間周波数分析を実行する線形変換120〜121がそれぞれのブロックに適用され、ブロック内の間隔をあけて並べられているサンプルを、一般的にそのブロック間隔上の対応する周波数帯域内のデジタル信号の強度を表す一組の周波数(または変換)係数に変換する。圧縮するため、変換係数を選択的に量子化し130(すなわち、係数値の最下位ビットを落とすか、または他の何らかの手段により高い分解能の数値群の中の値を低い分解能にマッピングすることなどにより分解能を下げられる)、エントロピーまたは可変長を圧縮データストリーム内に符号化することができる。復号化では、変換係数を逆変換し170〜171、元の色/空間サンプリングイメージ/ビデオ信号をほぼ再構成する(ブロック
Figure 0004874642
が再構成される)。
ブロック変換120〜121は、サイズNのベクトルxに対する数学演算として定義することができる。最も多い演算は、行列乗算であり、これは、Mを変換行列として変換領域出力y=Mxを生成する。入力データの長さが任意である場合、サイズNの複数のベクトルにセグメント分割され、ブロック変換がそれぞれのセグメントに適用される。データ圧縮の目的のために、可逆なブロック変換が選択される。すなわち、行列Mは逆行列を持つ。多次元では(例えば、イメージおよびビデオの場合)、ブロック変換は、通常、分離可能な演算(separable operations)として実装される。行列乗算は、データのそれぞれの次元(すなわち、行と列)にそって別々に適用される。
圧縮するため、変換係数(ベクトルyの成分)を選択的に量子化し(すなわち、係数値の最下位ビットを落とすか、または他の何らかの手段により高い分解能の数値群の中の値を低い分解能にマッピングすることなどにより分解能を下げられる)、エントロピーまたは可変長を圧縮データストリーム内に符号化することができる。
復号化器150での復号化において、これらの演算の逆演算(逆量子化/エントロピー復号化160および逆ブロック変換170〜171)が、図1に示されているように、復号化器150側に適用される。データを再構成している間に、逆行列M−1(逆変換170〜171)を乗数として変換領域データに適用する。変換領域データに適用されると、逆変換は、元の時間領域または空間領域デジタル媒体をほぼ再構成する。
多くのブロック変換に基づく符号化アプリケーションでは、量子化係数に応じてロッシー圧縮およびロスレス圧縮の両方をサポートするために変換は可逆であるのが望ましい。例えば、量子化を行わない場合(一般に、量子化係数1で表される)、可逆な変換を使用するコーデックは、復号化時に入力データを正確に再現することが可能である。しかし、これらのアプリケーションにおける可逆性の要件は、コーデックを設計できる変換の選択を制約することになる。
多くのイメージおよびビデオ圧縮システム、特にMPEGおよびWindows(登録商標)Mediaなどは、離散的コサイン変換(DCT)に基づく変換を利用する。DCTは、最適に近いデータ圧縮をもたらす好ましいエネルギー圧縮特性を有することが知られている。これらの圧縮システムでは、個別のイメージブロックを再構成するため圧縮システムの符号化器と復号化器の両方の再構成ループ内で逆DCT(IDCT)が使用される。DCTは文献で説明されている(例えば、非特許文献1を参照)。IDCTの実装例は文献で説明されている(例えば、非特許文献2を参照)。
可逆な2Dデータ圧縮器を実装するために使用される従来のデータ変換には、一般に、以下の主要な欠点のうちの1つまたは複数があった。
1.複雑なエントロピー符号化のしくみを必要とし、変換係数間でノルムが等しくない 2.DCTなどの最適な変換の近似が劣る
3.計算の複雑さが大きい
(2D変換の従来の実装)
分離可能な2D変換は、通常、データの行に対し1D変換を実行した後、データの例に対し1D変換を実行する(またはその逆)ことにより実装される。(例えば、非特許文献3を参照)。行列表記では、Tで変換行列を表し、Xを2Dデータとする。Tを持つ分離可能な2D変換は、以下の式の中のYにより定義される。
Y=TXT (1)
実際に、行方向および列方向の変換は異なるものとすることができる。例えば、データ行列は、非方形(例えば、4×8のサイズ)、または行方向および列方向の変換は、それぞれDCTおよび離散的サイン変換(DST)とすることが可能である。この場合、左から掛ける乗数と右から掛ける乗数は、異なり(すなわち、T1およびT2)、および変換Yは、
Figure 0004874642
により与えられる。
例えば、図2は、2段階で実装される2D 4×4DCTを示している。第1段では、データ行列の列が、4点(4 point)1D DCTを使用して変換される。第2段では、4点1D DCTが行にそって適用される。無限な算術精度では、この順序付けは、出力の変更なしで切り替えることができる。
4点1D DCTは、図3に示されている信号フローグラフで表されるように、4点入力データ値に対する乗算および加算の演算シーケンスとして実装することができる。この図の値cおよびsは、それぞれ、π/8のコサインおよびサインである。分離可能なデータ変換アプローチは、ロッシーコーデックの場合にうまく働く。ロスレスコーデックは、実現がより難しい。単位量子化であっても、分離可能な逆DCTまたはIDCTとともに上で説明されている分離可能な2D DCTは、元の入力とビット毎に正確に一致することを保証されない。これは、図3の除数から、符号化器と復号化器との間で無効にならない丸め誤差が生じるためである。
(リフティング)
ブロック変換に基づくコーデックを使用してロスレス圧縮を実現するためには、上述の4×42D DCTをロスレス変換で置き換える必要がある。分離可能な変換は、各々の1D変換がロスレスまたは可逆である場合のみ使用できる。可逆な1D変換に対し複数の選択が存在するが、「リフティング」に基づく変換は、最も望ましい。リフティングは、連続する「剪断(shear)」を使用して行列−ベクトル乗算を実行するプロセスである。剪断は、オペランドのベクトルと単位行列に1つの非ゼロ非対角要素を加えたものである行列との乗算として定義される。1つまたは複数のベクトル係数の符号反転は、一般性を失うことなく、このプロセスのどこかに置くことができる。
リフティングは、従来、はしご、または格子フィルタ構造を通じて実装されている。グラフィックスでは、リフティングまたは連続剪断に基づく手法が使用されている(例えば、非特許文献4および5を参照)。実際には、ガウスジョルダン消去法は、リフティングの1つの表現であると主張することができる。
単純な2点演算(2 point operation)の1つは、アダマール変換であり、これは、変換行列
Figure 0004874642
により与えられる。リフティングに基づく(可逆な)1Dアダマール変換を実装するために、2つのアプローチが一般に使用される。第1のアプローチでは、図4に示されているように、リフティングステップで正規化またはスケールフリーのアダマール変換を実装する。第2のアプローチでは、図5に示されているように、2つの変換係数間でスケールが異なるようにできる。
(リフティングの問題)
リフティングは、問題なしではない。図4に示されている第1のアダマール変換アプローチでは、2つの変換係数が正規化される。これは、4または8点DCTなどの多段変換を実現する場合に望ましい。しかし、この実装には、第1に、それぞれの2点アダマール変換は3つの非自明な(すなわち、計算量が多い)リフティングステップを必要とすること、および第2に、リフティングステップの丸め誤差のためローパスエネルギーが高周波項に「漏れ」て圧縮効率が低下するという2つの大きな欠点がある。この第1のアプローチでは、近似式
Figure 0004874642
および
Figure 0004874642
を使用することで、AC基底関数が得られる[0.75〜0.7188]。必要な[0.7071 0.7071]からの食い違いは、ひどく大きいようには見えないが、振幅64のDC信号により、2単位のAC応答を生成し、これが符号化のコストが高い高周波帯域に漏れる。
第2のアプローチ(図5)では、自明なリフティングステップを使用する。しかし、ローパス項は、
Figure 0004874642
の倍率で大きくされるが、ハイパス項は、
Figure 0004874642
の倍率で小さくされる(またはその逆)。この2つの係数の分解能の差は1ビットである。2つの次元において、ハイ−ハイ項はロー−ロー項と比べて分解能が2ビットだけ小さい。カスケード変換段は、この食い違いを大きくすることしかしない。エントロピー符号化は、係数の範囲が異なるためより実装が困難である。
要約すると、リフティングに基づくロスレス変換の問題は、以下のとおりである。
1.より複雑なエントロピー符号化メカニズムにかかわる、変換係数間の等しくないスケーリングの可能性。
2.DCがAC帯域に漏れるなどの望ましくない影響を引き起こす可能性のある、所望の変換基底関数に対する精度の低い近似。
3.潜在的に高い計算複雑度、特に、リフティングに基づく実装が所望の変換を適切に近似するように設計されている場合に高い。
N. Ahmed, T. Natarajan, and K.R. Rao, "Discrete Cosine Transform," IEEE Transactions on Computers, C-23 (January 1974), pp. 90-93. "IEEE Standard Specification for the Implementations of 8x8 Inverse Discrete Cosine Transform," IEEE Std 1180-1990, December 6, 1990 A. K. Jain, "Fundamentals of Digital Image Processing," Prentice Hall, 1989. A. Tanaka, M. Kameyama, S. Kazama, and O. Watanabe, "A rotation method for raster image using skew transformation," Proc IEEE Conf on Computer Vision and Pattern Recognition, pages 272-277, June 1986 A. W. Paeth, "A fast algorithm for general raster rotation," Proceedings of Graphics Interface '86, pages 77-81, May 1986
デジタル媒体符号化器/復号化器システムは、従来技術による変換の上述した問題点および欠点に向けられる本明細書において説明するさまざまな実装を含む分離可能な2Dブロック変換に基づく。特に、分離可能な2D変換とその逆変換のペアの説明されている実装は、計算複雑度を低くするように一連のリフティングステップを配列したものである(すなわち、多数の非自明な演算を削減する)。この変換ペアは、DCTに類似したエネルギー圧縮特性を有し、さらにロスレスであり、およびスケールフリーである。「ロスレス(lossless)」という用語は、変換に入力された元の整数値を、量子化なしと仮定して、その整数変換係数から逆変換により誤差なしで復元できることを意味する。「スケールフリー(Scale−free)」は、変換ペアの基底関数が等しくスケーリングされることを意味し、さらにその結果得られる変換行列が直交行列であることをも意味する。
この変換ペアの説明されている1つ実装は、4×4変換としてのものであるが、他のサイズにも拡張できる(例えば、8×8など)。さらに、変換ペアのカスケードを使用して、階層ピラミッドおよびさらに大きな変換を実現することが可能である。例えば、1つの説明されている実装では、2レベルカスケードの変換を使用する。第2の変換段では、変換は、マクロブロック内で生成された16個のDC係数に適用される。変換はDCTに類似しているので、卓越した速度歪み性能および圧縮効率で、ロスレス−ロッシーデジタル媒体コーデック(すなわち、量子化パラメータをロスレス設定からロッシー設定に変更することができるコーデック)を実現できる。
本発明の他の特徴および利点は、付属の図面を参照しつつ進行する実施形態の以下の詳細な説明から明白になる。
以下の説明は、改良された可逆なスケールフリー2D変換を使用する、デジタル媒体圧縮システムまたはコーデックに関する。例示のため、改良された変換を組み込む圧縮システムの一実施形態は、イメージまたはビデオ圧縮システムである。あるいはまた、改良された変換は、さらに、他の2Dデータ用の圧縮システムまたはコーデックに組み込むことも可能である。変換は、デジタル媒体圧縮システムが特定の符号化形式において圧縮デジタル媒体データを符号化することを必要としない。
(1.符号化器/復号化器)
図6および7は、後述の改良された可逆なスケールフリー2D変換650に基づく代表的な二次元(2D)データ符号化器600および復号化器700で使用されるプロセスの一般化された図である。図は、2Dデータ符号化器および復号化器を組み込んだ圧縮システムにおけるこの変換の使用および適用を一般化された、または簡略化された例示を提供する。この変換に基づく代替の符号化器では、2Dデータ圧縮に使用することができるプロセスを、この代表的な符号化器および復号化器で例示されているものに追加することも、減らすこともできる。例えば、いくつかの符号化器/復号化器は、さらに、色変換、色形式、スケーラブル符号化(scalable coding)、ロスレス符号化、マクロブロックモードなどを含むことができる。改良された2D変換では、圧縮システム(符号化器および復号化器)は、ロスレスからロッシーまで変化する量子化パラメータに基づく量子化に応じて、2Dデータのロスレスおよび/またはロッシー圧縮を実行することができる。
2Dデータ符号化器600は、符号化器に入力されたとおりに送られる2Dデータ610のよりコンパクトな表現(典型的な入力の)である圧縮されたビットストリーム620を生成する。例えば、2Dデータ入力は、イメージ、ビデオシーケンスのフレーム、または2つの次元を持つ他のデータとすることができる。2Dデータ符号化器は、入力されたデータを、この代表的な符号化器においてサイズが16×16ピクセルである複数のマクロブロックにタイル化する630。2Dデータ符号化器は、さらに、それぞれのマクロブロックを4×4ブロック632にタイル化する。「順オーバーラップ(forward overlap)」演算子640は、ブロック間のそれぞれのエッジに適用され、その後、それぞれの4×4ブロックが可逆なスケールフリー変換650を使用して変換される。その後、それぞれの4×4変換ブロックのDC係数660に対し、類似の処理連鎖(タイリング、順オーバーラップ、その後4×4ブロック変換)が適用される。その結果得られるDC変換係数およびAC変換家因数は、量子化670され、エントロピー符号化680され、パケット化690される。
復号化器は、逆プロセスを実行する。復号化器側では、それぞれのパケットから変換係数ビットが抽出710され、そこから係数がそれ自体復号化720され、逆量子化730される。DC係数740は、逆変換を適用することにより再生成され、DC係数の平面は、DCブロックエッジ間に適用される適当な平滑化演算子を使用して「逆オーバーラップ」される。その後、データ全体が、4×4逆変換750をDC係数に適用することにより再生成され、AC係数742がビットストリームから復号化される。最後に、その結果得られるイメージ平面内のブロックエッジが逆オーバーラップ760によりフィルタ処理される。これは、再構成された2Dデータ出力を生成する。
(2.改良された可逆なスケールフリー変換の実装)
非特許文献3で説明されているように、分離可能な2D変換は、同様の順序付けされたベクトルの結果を生成する、1Dにおいて順序付けされたデータに作用する1D変換として実装することができる。等しい変換行列は、分離可能な場合に使用される左および右から掛ける乗数のクロネッカー積により生成される。xおよびyが(2)でその2D表現から順序を変更して得られるデータおよび変換ベクトルを表す場合、その関係は、
y=Tx (3)
で与えられるが、ただし、
T=Kron(T,T
である。
式(2)で示されている2D変換分離可能な実装は式(3)よりも計算効率が高いが(漸近的意味で)、後者の表現のほうが望ましい特性を持つ場合もある。例えば、式(3)に基づく実装は、単一段行列乗算(本質的に複数のデジタルシグナルプロセッサ(DSP)上でサポートされる演算)のため、式(2)よりも低い待ち時間を持つ。本明細書で説明されている改良された可逆なスケールフリー変換については、2×2ステップの1D表現により、スケールフリーの可逆な構造が得られる。
さらに、分離可能な2D変換は、より単純な1D変換のカスケードとして実装することができる。変換行列TおよびTは以下のように分解できると仮定する。
=T1A1B
=T2A2B (4)
行列乗算演算の結合性を使用して、2D変換(2)を
Figure 0004874642
のように順序変更し、カスケード化された1D実装
y=Kron(T1A,T2A)・Kron(T1B,T2B)・x (6)
を得ることができる。
DCTなどの変換は、基本的な2点回転演算のカスケードとして定式化することができる。2D DCTは、先に詳述される、いくつかの望ましい特性を持つように(6)の構造を使用して定式化することができる。
(A.2Dアダマール変換)
2Dアダマール変換は、1D演算として実装され、クロネッカー積
Figure 0004874642
により生成される。
自明なリフティングステップのみを使用して、式(7)に対応するスケールフリーの可逆な変換を実現することが可能であることは興味深い。この形式の実装は、図8に信号フローグラフ800として示されている。いくつかの冗長な演算をなくした対応するC++コードは、図9に示されている。このコードリスト900では、「swap(x,y)」は引数の値を入れ換える関数である。
上述のことから、正規化された可逆な2Dアダマール変換は、自明なリフティングステップのみを使用して定式化できるが、これは、おそらく「より単純な」1Dアダマールの場合に対しては可能でない。変換行列それ自体はインボリュートリ(involutory)(すなわち、Tはそれ自体の逆変換)であるが、ロスレス再構成では、丸めの効果を正確に再現するようにリフティングステップを慎重に反転する必要がある。図8の構造800の逆1000は、図10に示されている。構造1000は、この場合における順変換と同じである。変換係数BおよびCは、信号フローグラフにおいて順序変更されることに注意されたい。
図6の符号化器600における可逆なスケールフリー2D変換650では、4×4 DCTへの近似を使用する。以下の説明では、変換650の変換プロセス全体を、2×2アダマール変換である3つの基本的な2×2変換演算のカスケード、および以下の式で、実現できることを実証している。
Figure 0004874642
ただし、2点回転行列Tは以下の式で与えられる。
Figure 0004874642
式(8)の1D実装は、左および右から掛ける変換行列(小数点以下4桁の小数に近似)
Figure 0004874642
および
Figure 0004874642
のクロネッカー積を計算することにより得られる。キャレット^は所望の変換行列を表す。実際の実装からの結果として得られる近似は、キャレットを伴わない。2×2アダマール変換では、所望の変換行列およびその近似は同じである。したがって、Tは、明確さを失うことなく、1Dで実装される2×2アダマール変換を表すために使用される。次に、ToddおよびTodd−oddのリフティング実装を調べる。
(B.Toddの実装)
odd変換1100のスケールフリーのリフティングに基づく実装は、図11では信号フローグラフとして、図12ではC++コードプログラムリスト1200において示される。最初および最後のリフティング段階は、アダマール変換の場合と同じであることがわかる。自明な剪断のほかに、2つの非自明なリフティング回転は、中間段階で適用される。各々の非自明な回転は、3を掛け、および3または4ビットだけビットシフトする、3ステップにおいて実装される。したがって、Toddは、6つの非自明なリフティングステップを使用することにより可逆なスケールフリーの方法において実現できる。
結果である1D変換行列Toddは、以下の(12)に示されており、これは、(10)の
Figure 0004874642
の元の定式化によく一致している。その結果得られる変換行列の第2および第4の行の和は0となり、DCはAC帯域に漏れないことを意味していることがわかる。この望ましい特性が達成されるが、必要な2D回転が構造において単に近似されるだけである。
Figure 0004874642
変換行列Toddはインボリュートリ(すなわち、それ自体の逆変換)であるが、丸め誤差は、信号フローグラフまたはコードの2回連続適用で消えない。Toddのロスレス逆変換は、信号フローグラフまたはC++コードのいずれかでリフティングステップを反転することにより導かれ、順変換側の丸め誤差を複製する。Toddの逆変換1300の信号フローグラフは、図13に示されている。コードも同様に導くことができる。
(C.Todd−oddの実装)
odd−odd変換1400は、2つの回転からなるが、いずれもアダマール変換ではない。Todd−oddは、Toddよりも少ない非自明なリフティングステップで実現できることは興味深い。これは、Tとそれ自身とのクロネッカー積の対称特性によるものである。Todd−odd変換1400の信号フローグラフおよびそのC++コード実現のプログラムリスト1500がそれぞれ図14および15に示されている。
odd−oddを実現するために、3つの非自明なリフティングステップにより実装される1つの非自明な回転のみが必要であることがわかる。この回転は、スケールフリー1D 2点アダマール変換に対応する。
Figure 0004874642
ここで考察されている他の変換と同様、式(13)で表されているようなTodd−oddはインボリュートリであるが、それ自体のビット毎に正確な逆変換ではない。Todd−oddのロスレス逆変換1600は、図16に示されているように、順変換に使用される信号フローグラフを反転することにより得られる。
(D.上記の2×2変換実装の表記および導き方)
これらの3つの可逆なスケールフリー変換を使用した可逆なスケールフリー2D変換の説明では、以下の点が適用される。第1に、上記信号フローグラフおよびC++コードで得られる2×2データの順序付け1700は、図17に示されているとおりである。空間領域点は、左に示され、対応する周波数領域点は、右に示されている。4つのデータ点を示すために4つの灰色レベルを使用するカラーコーディングをここで導入し、以下の可逆なスケールフリー2D変換の説明をわかりやすくする。
多くの場合、2点変換または回転は、以下の演算
Figure 0004874642
として定義され、インボリュートリ形式
Figure 0004874642
として定義されない。
これら2つの形式は、第2の変換係数の符号が異なるだけなので、本質的に同じである。本明細書では、後者の表現(15)が使用されているが、本明細書の導出全体は、等しく、前者の形式(14)にも適用可能である。
上で定義されている基本的な2×2変換、T、Todd、およびTodd−oddの構造は、各々の2点変換が回転であることに注意して構成される。さらに、2つの2点回転のクロネッカー積は以下の式で与えられる。
Figure 0004874642
次に、演算子Hを以下のように定義する。
Figure 0004874642
Hは非正規化二重バタフライ演算を表しており、およびリフティングを使用して効率よく実装することができる。
以下の因数分解が成立する。
Figure 0004874642
これに基づき、型Tのクロネッカー積は、以下の3段階のカスケードとして実装することができる。
A.リフティングステップを使用してHにより定義される二重バタフライ演算。
B.成分の第1のペアの間、および成分の第2のペアの間の2点回転。
C.ステップaで実行される二重バタフライの反転。
特別な場合のTでは、よりいっそう単純な分解が存在し、これは、図8の信号フローグラフとして示され、上で説明されている。他の場合(例えば、ToddおよびTodd−odd)では、その結果の構造は、図25に示されているフローグラフ2500として一般化することができる。
上述の変換(およびその逆変換)の3つの信号フローグラフを調べると、その構造の中に基本的な類似性が見つかる。変換の第1段は、a−dとb−c係数との間のリフティング演算である。同様に、最終段は、逆リフティングプロセスである(符号および係数交換を無視する)。それに対応して、逆変換の第1段は、AとDとの間のリフティング演算、さらに、BとCとの間のリフティング演算であり、反転演算は最終段である。対角要素間のリフティングステップは、ここで示されている組み合わされた2D 2×2変換の際立った特徴である。
次の節では、4×4 DCT/IDCTを近似する、ロスレススケールフリー変換の構成について説明する。この変換の実施例はこの詳細な技術説明において示されているが、他の2×2の基本的な可逆なリフティングに基づく変換の追加定義とともに同じ手順を使用して、望ましい特性を有するさらに高次元の可逆な変換実施形態を生成することができる。
(E.ロスレススケールフリー変換)
4点DCTは、図3の信号フローグラフに示されているように4つのバタフライ演算のシーケンスに換算することができる。第1段は、2点アダマール演算を入力データに対し実行する2つのバタフライ演算からなる(すなわち、入力データのインデックスが0および3の第1の2点アダマール、および入力インデックスが1および2の第2のもの)。第2段は、偶数周波数成分(インデックス0および2)を生成する第1段のローパス結果に対する2点アダマール演算、および奇数周波数成分(インデックス1および3)を生成するπ/8の2点回転を含む。
2つの次元において、DCTは、別々に実装することができ、まず、4×4入力データの各々の列の垂直1D 4点DCT、次に、その行の水平1D 4点DCT(またはその逆)の順に行う。これは、図18で分離可能なDCT実装1800として示されている。それとは別に、上述の2つの1D DCT段は、図19のインターリーブされたDCT実装1900として示されているように、式(5)の理論を使用して、水平と垂直との間でインターリーブすることができる。
さらに、上述のアプローチに従った場合、対応する水平段および垂直段をさらに組み合わせることができる。例えば、第1段は、「内側」および「外側」入力要素に対する2点アダマール変換である。水平および垂直段をマージして、16個の入力データ要素に2×2 2Dアダマール変換を4回適用するようにでき、各々の変換は、対称的な入力点の集合に適用される。同様に、第2の段の水平および垂直ステップを合体して、1つの2×2アダマール変換と3つの2×2変換とにすることができ、そのうち2つは転置行列である。後者の3つの2×2変換は、実際には前のほうで定義されたToddおよびTodd−oddの2D再マッピングである。
より具体的には、可逆なスケールフリー2D変換650(図6)は、変換演算を2×2アダマール、ToddおよびTodd−odd変換の配列にそのように再配列することにより実装される。この変換650の2つの段は、それぞれ、図20および21に示されているように実行される。各々の段は、任意の順序で、または同時に、その段の中で、実行できる4つの2×2変換からなる。
2D逆変換750(図7)では、それらの段は、順序を逆にされ、および変換の各々の段内のステップでは、ステップの逆を順変換プロセスで使用する。上に指摘したように、可逆な2×2アダマール変換Tは、ビット毎に正確であるという意味で、またはロスレスの意味で、自己逆変換である。したがって、逆フォトン変換の第2段は、図20に示されているように、順フォトン変換の単に第1段にすぎない。逆フォトン変換の第1段2200は、図22に示されている。この段の中の4つのステップ(順変換の場合については、任意の順序または同時に実行できる)は、前のほうで定義されているようにT、Todd、およびTodd−oddの逆変換を適用し、2D 2×2空間に再マッピングで戻される。
図20および21で示されている改良された順2D変換のステップに続いて、その結果得られる変換係数は図23に示されているように順序付けされる。同じ順序付け2300が、その順序で図22および20のステップを使用して逆変換される係数について仮定される。
順2D変換650の上述の改良された実装では、Tを5回、Toddを2回、Todd−oddを1回、それぞれの4×4ブロックに適用する。これらの変換を同じ回数だけ適用することは、逆2D変換750の実装に伴う。したがって、非自明なリフティングステップの総数は、それぞれのブロックについて5×0+2×6+1×3=15であり、ロスレス順または逆2D変換を実現する。これは、ピクセル毎に1個程度の非自明なステップである。非自明なステップは、(3×x+r)>>kの形式の演算であり、ただし、xはオペランド、rおよびkは、丸めおよびビットシフトを決定する定数である。kは、2、3、または4のいずれかである。同様に、ブロック毎に1桁右シフト(すなわち、x>>1)が17回実行される。加算、減算、およびマイナス(negation)は、本概要において含めない。
比較として、図18に例示されている2D DCTの分離可能な実装1800を考察する。各々の4点DCTは、図3に示されているように3つの2点正規化アダマール演算を使用して実装され、およびπ/8の回転は、3つの非自明なリフティングステップを使用して実装されることを仮定する。順変換または逆変換のいずれかに対する4×4ブロック毎の非自明なリフティング演算の総数は、2×4×3=24である。1桁右シフトの総数も24である。これらの数値は、結果として得られる変換はノルムが1/4から2まで(または無理数範囲の基底関数を回避する場合には4まで)の範囲である基底関数を生成するという事実を考慮せずに、改良された順変換650および逆変換750の実装よりも約50%高い。対照的に、改良された変換650のすべての基底関数は単位ノルムである。
(F.4:2:0色空間に対する改良された変換)
符号化器600(図6)および復号化器700(図7)の一実施例では、YUV 4:2:0色空間を使用して、イメージ(またはビデオフレーム)内のピクセルの色を表現する。このコーデックの実施例では、YUV 4:2:0色空間におけるマクロブロックは、輝度(Y)チャネルにおける16×16タイル、およびクロミナンス(UおよびV)チャネルにおける8×8タイルとして定義される。これらは、さらに、上述の変換650を使用して符号化された変換である4×4ブロックに分割される。4×4変換650は、輝度チャネルのDC係数に適用される。しかし、マクロブロック内ではクロミナンスの2×2サンプルしか使用できない。次に、コーデックの実施例では、上述しているように可逆なスケールフリー2×2アダマール変換であるTを各々のマクロブロック内のDCクロミナンス値に適用する。したがって、コーデック形式の実施例のマクロブロック構造は保存され、および4:2:0形式を取り扱うためにコーデックに追加変換を導入する必要はない。
(G.丸め誤差の最小化)
丸め誤差は、右ビットシフトを伴うT、Todd、Todd−odd変換のリフティングステップに導入される。これらの丸め誤差は、知られているバイアスを持ち、および変換の過程で蓄積する可能性がある。例えば、x+=(y>>1)という形式のステップは、数学的に同等な式x:=x+y/2と比較してxの値に−1/4のバイアスが入る。これは、(y>>1)は切り捨てられる2による除算であり、yが偶数であれば正確な値であり、yが奇数であれば1/2だけ離れる。したがって、確率論的に、これは−1/4だけバイアスされる。丸め誤差は、リフティングを伴う整数−整数変換には不可避であるが、システム全体ではバイアスを最小限に抑えることが望ましい。
上でC++コードスニペットとして示されているT、Todd、およびTodd−oddの定式化は、除算される、または右ビットシフトされるオペランドにさまざまな因子を加える。これらの因子は、バイアスを最小にするように選択される。特に、図9のC++コードリスト900を使用する(未バイアス入力への)Tの第1段演算の後4つの変換係数のバイアスは、[1/4 −1/4 −1/4 −1/4]であることを示すことができる。改良された2D変換650(図6)でのTの第2段の適用は、第1段のDC値、すなわち、すでに1/4にバイアスされている係数に作用する。第2段の演算の結果から、[3/4 −1/4 −1/4 −1/4]のバイアスが生成される。第1の係数はDCのDCであるため、大きいことが予想され、また3/4の比較的高いバイアスは、コーティング性能に影響を及ぼさない。
oddおよびTodd−oddの非自明なリフティングステップは、変換バイアスを最小にする丸め係数を選択する自由度がある。Todd−oddに対するC++コードリスト1500(図15)は、ときには中心外れ丸め規則(a+=(3b+5)>>3など)によりバイアス全体が小さくなり、特に入力データがそれ自体バイアスされている場合にはそうであることを示している。改良された2D変換ステップToddおよびTodd−oddでは、すべての入力は−1/4にバイアスされる。
通常、コーデックの定義は、ビットストリームの復号化器の定義に制限される。符号化器および復号化器は入力データが損失なしで再構成されることを完全に見張っていなければならないため、この規則の例外はロスレスコーデックに対してのものである。これは、ロッシー−ロスレスコーデックの場合、符号化器と復号化器の両側で定義される。しかし、符号化器が純粋にロッシーモードで動作する場合、コーデックの仕様で定義されているようなベースラインの性能よりも(速度歪み、または計算サイクルカウントに関して)よい性能を発揮できる何らかのショートカットまたは機能強化を可能にする。
符号化器の性能を改善する1つの手段は、係数バイアスの変換に関係する。各々の4×4ブロックに対して、以下の手順を実行することにより符号化器600/復号化器700のいくつかの実施形態におけるバイアスの影響を低減することが可能である。
1.m=2(通常は、m=4で十分)を掛けて4×4ブロックをスケールアップする。
2.ブロックに対し改良された2D変換650を実行する。
3.元の所望の量子化パラメータのm倍である量子化器を使用してブロックを量子化する(例えば、32の量子化係数(QP)を、ステップ1で所望のQPが8、m=4であれば使用する)。
復号化器700側に変化はなく、その上よいのはPSNR数が同じビットレートで可能である。もちろん、これは、ロスレス符号化については機能しない。
(3.コンピューティング環境)
改良された可逆なスケールフリー2D変換を使用する上述のコーデックは、とりわけ、コンピュータ、イメージおよびビデオ記録、伝送および受信機器、携帯型ビデオプレーヤ、ビデオ会議装置などを含む、デジタル媒体信号処理が実行されるさまざまなデバイスのどれかで実行することができる。デジタル媒体符号化技術は、ハードウェア回路だけでなく、図24に示されているようなコンピュータまたはその他のコンピューティング環境内で実行中のデジタル媒体処理ソフトウェアで実装することができる。
図24は、説明されている実施形態を実装できる好適なコンピューティング環境(2400)の一般化された実施例を例示している。本発明は多様な汎用または専用コンピューティング環境に実装できるため、コンピューティング環境(2400)は、本発明の使用または機能性の範囲に関する制限を示唆する意図はない。
図24を参照すると、コンピューティング環境(2400)は、少なくとも1つの処理ユニット(2410)およびメモリ(2420)を備える。図24で、この最も基本的な構成(2430)は、破線で囲まれている。処理ユニット(2410)は、コンピュータ実行可能命令を実行し、実プロセッサでも、仮想プロセッサでもよい。マルチプロセッシングシステムでは、処理能力を高めるため、複数の処理ユニットがコンピュータ実行可能命令を実行する。メモリ(2420)は、揮発性メモリ(例えば、レジスタ、キャッシュ、RAMなど)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリなど)、またはこれら2つの何らかの組み合わせとすることができる。メモリ(2420)は、説明されている符号化器/復号化器および変換を実装するソフトウェア(2480)を格納する。
コンピューティング環境には、機能を追加することができる。例えば、コンピューティング環境(2400)は、記憶装置(2440)、1つまたは複数の入力装置(2450)、1つまたは複数の出力装置(2460)、および1つまたは複数の通信接続(2470)を含む。バス、コントローラ、またはネットワークなどの相互接続メカニズム(図に示されていない)は、コンピューティング環境(2400)のコンポーネントを相互接続する。通常、オペレーティングシステムソフトウェア(図に示されていない)は、コンピューティング環境(2400)内で他のソフトウェアを実行するためのオペレーティング環境を提供し、コンピューティング環境(2400)のコンポーネントの活動を調整する。
記憶装置(2440)は、取り外し可能であるか、または取り外し不可能であり、磁気ディスク、磁気テープまたはカセット、CD−ROM、CD−RW、DVD、または情報を格納するために使用することができ、コンピューティング環境(2400)内でアクセスできるその他の媒体を含む。記憶装置(2440)は、改良されたSDLTによりコーデックを実装するソフトウェア(2480)の命令を格納する。
入力装置(2450)は、キーボード、マウス、ペン、またはトラックボールなどの接触入力装置、音声入力装置、スキャニングデバイス、またはコンピューティング環境(2400)に入力を行う他のデバイスとすることができる。オーディオについては、入力装置(2450)は、サウンドカードまたは、アナログまたはデジタル形式のオーディオ入力を受け入れる類似のデバイス、またはコンピューティング環境にオーディオサンプルを供給するCD−ROMリーダーとすることができる。出力装置(2460)は、表示装置、プリンタ、スピーカ、CDライター、またはそのコンピューティング環境(2400)からの出力を供給する他のデバイスとすることができる。
通信接続(2470)では、通信媒体を介して、他のコンピューティングエンティティと通信することが可能である。通信媒体は、コンピュータ実行可能命令、圧縮オーディオまたはビデオ情報、またはその他のデータなどの情報を変調データ信号で伝達する。変調データ信号は、信号内の情報を符号化する方法によりその特性のうち1つまたは複数が設定または変更された信号である。例えば、限定はしないが、通信媒体は、電気的搬送波、光学的搬送波、RF搬送波、赤外線搬送波、音響搬送波、またはその他の搬送波により実装された有線または無線技術を含む。
本明細書のデジタル媒体処理技術は、コンピュータ可読媒体の一般的な文脈において説明することができる。コンピュータ可読媒体は、コンピューティング環境内でアクセスできる入手可能な媒体である。例えば、限定はしないが、コンピューティング環境(2400)では、コンピュータ可読媒体は、メモリ(2420)、記憶装置(2440)、通信媒体、およびこれらのどれかの組み合わせを含む。
本明細書のデジタル媒体処理技術は、ターゲットの実または仮想プロセッサ上のコンピューティング環境で実行される、プログラムモジュールに含まれるような、コンピュータ実行可能命令の一般的な文脈において説明することができる。一般に、プログラムモジュールは、特定のタスクを実行する、または特定の抽象データ型を実装するルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造などを含む。プログラムモジュールの機能は、さまざまな実施形態で望まれているように、組み合わせたり、または複数のプログラムモジュールに分割したりすることができる。プログラムモジュールのコンピュータ実行可能命令は、ローカルまたは分散コンピューティング環境内で実行することができる。
提示するため、詳細な説明では、「決定する」、「生成する」、「調整する」、および「適用する」のような用語を使用して、コンピューティング環境におけるコンピュータのオペレーションを説明する。これらの用語は、コンピュータにより実行されるオペレーションの高水準の抽象化であり、人間が実行する行為と混同すべきではない。これらの用語に対応する実際のコンピュータオペレーションは、実装によって異なることがある。
本発明の原理を適用できる多くの可能な実施形態の観点において、特許請求の範囲および均等に属する範囲および精神に収まりうるすべての実施形態を本発明として請求する。
従来技術において従来のブロック変換に基づくコーデックのブロック図である。 従来技術において2段に実装される2D 4×4 DCTのブロック図である。 従来技術において1D 4×4 DCTの信号フローグラフの図である。 従来技術において正規化された2点アダマール変換の信号フローグラフの図である。 従来技術において自明な2点アダマール変換の信号フローグラフの図である。 改良された可逆な2D変換に基づく符号化器のフロー図である。 改良された可逆な2D変換に基づく復号化器のフロー図である。 可逆な2×2アダマール変換の正規化されたリフティングに基づく実装の信号フローグラフの図である。 図8の正規化された可逆な2×2アダマール変換を実現するCプログラミング言語のプログラムリストの図である。 図8の正規化された可逆な2×2アダマール変換の逆変換の信号フローグラフの図である。 odd変換の正規化されたリフティングに基づく実装の信号フローグラフの図である。 図11の正規化されたTodd変換を実現するCプログラミング言語のプログラムリストの図である。 図11のTodd変換の逆変換の正規化されたリフティングに基づくバージョンの信号フローグラフの図である。 odd−odd変換の正規化されたリフティングに基づく実装の信号フローグラフの図である。 図14の正規化されたTodd−odd変換を実現するCプログラミング言語のプログラムリストの図である。 図14のTodd−odd変換の逆変換の正規化されたリフティングに基づくバージョンの信号フローグラフの図である。 変換および逆変換演算の本明細書の図における2×2データの順序付けを例示する図である。 4×4データ入力のそれぞれ列および行に適用される1D垂直DCTおよび1D水平DCTとして別々に実装される2D DCTを例示する信号フローグラフの図である。 2段における水平および垂直変換演算をインターリーブすることにより実装される可逆なスケールフリー2D変換を例示する信号フローグラフの図である。 図6の符号化器における改良された可逆な2D変換の実装の第1段において図8の2×2アダマール変換を適用する4×4データブロックの点を例示する図である。 図6の符号化器における改良された可逆な2D変換の実装の第2段において図8の2×2アダマール変換、図11のTodd変換、および図14のTodd−odd変換を適用する4×4データブロックの点を例示する図である。 図7の復号化器における2D逆変換の実装の第1段において図8の2×2アダマール変換、図11のTodd変換、および図14のTodd−odd変換を適用する4×4変換係数ブロックの点を例示する図である。 図6の符号化器および図7の復号化器における2D順変換および2D逆変換に対する変換係数の順序付けを例示する図である。 図6および7の改良された空間領域重複変換によりブロック変換に基づくコーデックを実装するのに適したコンピューティング環境のブロック図である。 図11および14に示す可逆な2×2変換の正規化されたリフティングに基づく実装に関する構造の信号フローグラフの図である。
符号の説明
1900 インターリーブされたDCT実装

Claims (20)

  1. データ圧縮符号化または復号化のために二次元デジタル媒体データを処理する方法であって、
    二次元デジタル媒体データの入力を受信するステップと、
    前記デジタル媒体データの二次元ブロック上で水平および垂直方向に適用される一次元変換として定義される可逆な二次元ブロック変換を使用して、前記デジタル媒体データに対して、ブロック変換ベースのデータ圧縮符号化または復号化を実行するステップであって、前記二次元ブロック変換は、前記水平および垂直方向の一次元変換における演算を水平方向の一次元変換と垂直方向の一次元変換との間でインターリーブして2つ以上の段を形成し、前記2つ以上の段の各々は、リフティングステップを用いて実装される変換のセットを有し、前記2つ以上の段における変換のセットを前記二次元ブロックにおける値の独立な部分集合に適用することにより実装され、前記水平および垂直方向の一次元変換の前記演算の前記インターリーブによって、非自明な演算の数は、前記水平および垂直方向の一次元変換の非インターリーブの適用の場合に比較して減少する、ステップと、
    前記符号化または復号化されたデジタル媒体データを出力するステップと
    を備えたことを特徴とする方法。
  2. 前記2つ以上の段の第1において、2×2アダマール変換を前記二次元ブロックにおける値の独立な4値の部分集合に適用するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  3. 前記2つ以上の段の第1段において、前記二次元ブロックは4×4二次元ブロックであり、前記4値の部分集合は、前記二次元ブロックの1行目1列目、1行目4列目、4行目1列目、4行目4列目の値からなる4つの値のグループと、前記二次元ブロックの2行目2列目、2行目3列目、3行目2列目、3行目3列目の値からなる4つの値のグループと、前記二次元ブロックの1行目2列目、1行目3列目、4行目2列目、4行目3列目の値からなる4つの値のグループと、前記二次元ブロックの2行目1列目、2行目4列目、3行目1列目、3行目4列目の値からなる4つの値のグループとを含むことを特徴とする請求項2に記載の方法。
  4. 前記2つ以上の段の第2において、変換のセットを前記二次元ブロックにおける値の独立な4値の部分集合に適用するステップをさらに備え、および前記変換のセットの少なくとも1つは、3つの段からなるカスケードの形式において実装され、
    リフティングステップを使用して演算子
    Figure 0004874642
    により定義される二重バタフライ演算と、
    それぞれ成分値の第1のペアの間、および成分値の第2のペアの間の2点(2−point)回転と、
    前記二重バタフライ演算の反転とを含むことを特徴とする請求項1に記載の方法。
  5. 前記2つ以上の段の第2において、2×2アダマール変換、2点アダマール変換と2つの点回転行列とのクロネッカー積として導かれる2×2奇数回転変換、および前記2つの点回転行列とのクロネッカー積として導かれる2×2奇数−奇数回転変換を含んだ変換のセットを前記二次元ブロックにおける値の独立な4値の部分集合に適用するステップをさらに備えたことを特徴とする請求項1に記載の方法。
  6. 丸め誤差バイアスを低減するために、除算または右ビットシフトを伴うバタフライ演算について、前記それぞれのバタフライ演算に先立って除算または右ビットシフトされるオペランドに可変係数を追加するステップをさらに備えことを特徴とする請求項1に記載の方法。
  7. ロッシー圧縮の丸め誤差バイアスを低減するために、
    前記変換に先立って、係数を掛けて前記二次元ブロックをスケーリングするステップと、
    前記変換を実行するステップと、
    前記係数を掛けた所望の量子化器に等しい量子化器により結果として得られる変換係数を量子化するステップと
    をさらに備えことを特徴とする請求項1に記載の方法。
  8. 二次元変換デジタル媒体データを処理する方法であって、
    符号化したデジタル媒体データの入力を受信するステップと、
    前記符号化したデジタル媒体データの二次元ブロック上で水平および垂直方向に適用される一次元逆変換として定義される可逆な二次元ブロック逆変換を使用して、前記符号化したデジタル媒体データに対して、ブロック変換ベースのデータ圧縮解除を実行するステップであって、前記符号化したデジタル媒体データの前記二次元ブロック逆変換は、前記水平および垂直方向の一次元逆変換における演算を水平方向の一次元逆変換と垂直方向の一次元逆変換との間でインターリーブして2つ以上の段を形成し、前記2つ以上の段の各々は、リフティングステップを用いて実装される変換のセットを有し、前記2つ以上の段における変換のセットを前記二次元ブロックにおける値の独立な部分集合に適用することにより実装され、前記水平および垂直方向の一次元逆変換の前記演算の前記インターリーブによって、非自明な演算の数は、前記水平および垂直方向の一次元逆変換の非インターリーブの適用の場合に比較して減少する、ステップと、
    前記圧縮解除された二次元デジタル媒体データを出力するステップと
    を備えたことを特徴とする方法。
  9. 前記2つ以上の段の第1において、2×2アダマール変換、2点アダマール変換と2つの点回転行列とのクロネッカー積として導かれる2×2奇数回転変換、および前記2つの点回転行列のクロネッカー積として導かれる2×2奇数−奇数回転変換を含んだ変換のセットを前記二次元ブロックにおける値の独立な4値の部分集合に適用するステップをさらに備えたことを特徴とする請求項8に記載の方法。
  10. 前記2つ以上の段の第1段において、前記二次元ブロックは4×4二次元ブロックであり、前記4値の部分集合は、前記二次元ブロックの1行目1列目、1行目2列目、2行目1列目、2行目2列目の値からなる4つの値のグループと、前記二次元ブロックの1行目3列目、1行目4列目、2行目3列目、2行目4列目の値からなる4つの値のグループと、前記二次元ブロックの3行目1列目、3行目2列目、4行目1列目、4行目2列目の値からなる4つの値のグループと、前記二次元ブロックの3行目3列目、3行目4列目、4行目3列目、4行目4列目の値からなる4つの値のグループとを含むことを特徴とする請求項9に記載の方法。
  11. 前記2×2アダマール変換、2×2奇数回転変換、および2×2奇数−奇数回転変換は、小数点以下4桁の小数に近似した、式
    Figure 0004874642
    および
    Figure 0004874642
    により与えられることを特徴とする請求項9に記載の方法。
  12. 前記2つ以上の段の第2において、2×2アダマール変換を前記二次元ブロックにおける値の独立な4値の部分集合に適用するステップをさらに備えたことを特徴とする請求項8に記載の方法。
  13. ブロック変換ベースの符号化により二次元デジタル媒体データのロッシー/ロスレス圧縮を実行するロッシー/ロスレス圧縮システムの符号化器であって、
    符号化される二次元デジタル媒体データをバッファリングするためのバッファメモリと、
    水平および垂直方向に適用される4点変換として定義される可逆な二次元ブロック変換を前記デジタル媒体データの二次元ブロックに適用するためのプロセッサであって、前記可逆な二次元ブロック変換を適用することは、水平および垂直方向の一次元4点変換における演算をインターリーブして2つ以上の段を形成することであって、前記2つ以上の段の各々はリフティングステップを用いて実装される2×2変換のセットを有する、ことと、前記2つ以上の段における2×2変換のセットを前記二次元ブロックにおける独立な4値の部分集合に適用することとを含む、プロセッサと
    を備え、前記プロセッサは前記二次元ブロックの前記変換により生じる前記変換係数をエントロピー符号化するためにさらに使用されることを特徴とする符号化器。
  14. 前記2×2変換は、2×2アダマール変換、2点アダマール変換と2つの点回転行列とのクロネッカー積として導かれる2×2奇数回転変換、および前記2つの点回転行列のクロネッカー積として導かれる2×2奇数−奇数回転変換を含むことを特徴とする請求項13に記載の符号化器。
  15. 前記2つ以上の段の第1段において、前記デジタル媒体ブロックは4×4二次元ブロックであり、前記4値の部分集合は、前記デジタル媒体ブロックの1行目1列目、1行目4列目、4行目1列目、4行目4列目の値からなる4つの値のグループと、前記デジタル媒体ブロックの2行目2列目、2行目3列目、3行目2列目、3行目3列目の値からなる4つの値のグループと、前記デジタル媒体ブロックの1行目2列目、1行目3列目、4行目2列目、4行目3列目の値からなる4つの値のグループと、前記デジタル媒体ブロックの2行目1列目、2行目4列目、3行目1列目、3行目4列目の値からなる4つの値のグループとを含み、前記プロセッサは、2×2アダマール変換を前記それぞれのデジタル媒体ブロックの4値の部分集合に適用することを特徴とする請求項13に記載の符号化器。
  16. 前記2つ以上の段の第2段において、前記デジタル媒体ブロックは4×4二次元ブロックであり、前記プロセッサは、2×2アダマール変換を前記それぞれのデジタル媒体ブロックの1行目1列目、1行目2列目、2行目1列目、2行目2列目の値からなる4値の部分集合に適用し、2×2アダマール変換、および前記2×2アダマール変換と2つの点回転行列とのクロネッカー積として導かれる2×2奇数回転変換を前記それぞれのデジタル媒体ブロックの1行目3列目、1行目4列目、2行目3列目、2行目4列目の値からなる4値の部分集合および前記それぞれのデジタル媒体ブロックの3行目1列目、3行目2列目、4行目1列目、4行目2列目の値からなる4値の部分集合に適用し、ならびに前記2つの点回転行列とともに前記2つの点回転行列のクロネッカー積として導かれる2×2奇数−奇数回転変換を前記各々のデジタル媒体ブロックの3行目3列目、3行目4列目、4行目3列目、4行目4列目の値からなる4値の部分集合に適用することを特徴とする請求項13に記載の符号化器。
  17. ブロック変換ベースの復号化により圧縮された二次元デジタル媒体データのロッシー/ロスレス圧縮解除を実行するロッシー/ロスレス圧縮システムの復号化器であって
    前記圧縮された二次元デジタル媒体データのブロックの変換係数をバッファリングするバッファメモリと、
    前記ブロックの前記変換係数をエントロピー復号化し、および前記デジタル媒体データの二次元ブロックに可逆二次元変換の逆変換を適用するためのプロセッサであって、前記二次元変換の逆変換は、水平および垂直方向の一次元4点変換の逆変換における演算をインターリーブして2つ以上の段を形成し、前記2つ以上の段の各々は、リフティングステップとして実装される2×2変換のセットを有し、前記2つ以上の段の前記2×2変換のセットを前記二次元ブロックにおける独立な4値の部分集合に適用することにより実装される、プロセッサと
    を備えたことを特徴とする復号化器。
  18. 前記2×2変換は、2×2アダマール変換、2点アダマール変換と2つの点回転行列とのクロネッカー積として導かれる2×2奇数回転変換、および前記2つの点回転行列のクロネッカー積として導かれる2×2奇数−奇数回転変換を含むことを特徴とする請求項17に記載の復号化器。
  19. 前記2つ以上の段の第1段において、前記デジタル媒体ブロックは4×4二次元ブロックであり、前記プロセッサは、2×2アダマール変換を前記それぞれのデジタル媒体ブロックの1行目1列目、1行目2列目、2行目1列目、2行目2列目の値からなる4値の部分集合に適用し、2×2アダマール変換、および2点アダマール変換と2つの点回転行列とのクロネッカー積として導かれる2×2奇数回転変換を前記それぞれのデジタル媒体ブロックの1行目3列目、1行目4列目、2行目3列目、2行目4列目の値からなる4値の部分集合および前記それぞれのデジタル媒体ブロックの3行目1列目、3行目2列目、4行目1列目、4行目2列目の値からなる4値の部分集合に適用し、ならびに前記2つの点回転行列のクロネッカー積として導かれる2×2奇数−奇数回転変換を前記それぞれのデジタル媒体ブロックの3行目3列目、3行目4列目、4行目3列目、4行目4列目の値からなる4値の部分集合に適用することを特徴とする請求項18に記載の復号化器。
  20. 前記2つ以上の段の第2段において、前記デジタル媒体ブロックは4×4二次元ブロックであり、前記4値の部分集合は、前記デジタル媒体ブロックの1行目1列目、1行目4列目、4行目1列目、4行目4列目の値からなる4つの値のグループと、前記デジタル媒体ブロックの2行目2列目、2行目3列目、3行目2列目、3行目3列目の値からなる4つの値のグループと、前記デジタル媒体ブロックの1行目2列目、1行目3列目、4行目2列目、4行目3列目の値からなる4つの値のグループと、前記デジタル媒体ブロックの2行目1列目、2行目4列目、3行目1列目、3行目4列目の値からなる4つの値のグループとを含み、前記プロセッサは、2×2アダマール変換を、前記それぞれのデジタル媒体ブロックの4値の部分集合に適用することを特徴とする請求項18に記載の復号化器。
JP2005364034A 2004-12-17 2005-12-16 ロッシーおよびロスレス2dデータ圧縮のための可逆な変換 Expired - Fee Related JP4874642B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/015,707 2004-12-17
US11/015,707 US7471850B2 (en) 2004-12-17 2004-12-17 Reversible transform for lossy and lossless 2-D data compression

Publications (2)

Publication Number Publication Date
JP2006197572A JP2006197572A (ja) 2006-07-27
JP4874642B2 true JP4874642B2 (ja) 2012-02-15

Family

ID=36088389

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005364034A Expired - Fee Related JP4874642B2 (ja) 2004-12-17 2005-12-16 ロッシーおよびロスレス2dデータ圧縮のための可逆な変換

Country Status (10)

Country Link
US (1) US7471850B2 (ja)
EP (1) EP1672517B1 (ja)
JP (1) JP4874642B2 (ja)
KR (1) KR101036731B1 (ja)
CN (1) CN1791222B (ja)
AU (1) AU2005237142B2 (ja)
BR (1) BRPI0506084B1 (ja)
CA (1) CA2526762C (ja)
MX (1) MXPA05012403A (ja)
RU (1) RU2413983C2 (ja)

Families Citing this family (39)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2005239628B2 (en) 2005-01-14 2010-08-05 Microsoft Technology Licensing, Llc Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform
US8036274B2 (en) * 2005-08-12 2011-10-11 Microsoft Corporation SIMD lapped transform-based digital media encoding/decoding
KR100846870B1 (ko) * 2006-07-06 2008-07-16 한국전자통신연구원 다수의 기본 블록들의 다차원 구성을 통한 다단계 변환장치 및 그 방법
US20080159637A1 (en) * 2006-12-27 2008-07-03 Ricardo Citro Deblocking filter hardware accelerator with interlace frame support
US8515194B2 (en) * 2007-02-21 2013-08-20 Microsoft Corporation Signaling and uses of windowing information for images
US20080288568A1 (en) * 2007-05-14 2008-11-20 Hou Hsieh S Low power Fast Hadamard transform
TWI370690B (en) * 2008-03-21 2012-08-11 Novatek Microelectronics Corp Method and apparatus for generating coded block pattern for highpass coeffecients
TWI382768B (zh) * 2008-03-24 2013-01-11 Novatek Microelectronics Corp 具有執行重疊濾波以及核心轉換的運算方法及其裝置
US8369638B2 (en) 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
US8290782B2 (en) 2008-07-24 2012-10-16 Dts, Inc. Compression of audio scale-factors by two-dimensional transformation
US8275209B2 (en) * 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
US9110849B2 (en) * 2009-04-15 2015-08-18 Qualcomm Incorporated Computing even-sized discrete cosine transforms
JP5451171B2 (ja) * 2009-05-13 2014-03-26 キヤノン株式会社 データ変換処理装置およびデータ変換処理方法
US8762441B2 (en) 2009-06-05 2014-06-24 Qualcomm Incorporated 4X4 transform for media coding
US9069713B2 (en) 2009-06-05 2015-06-30 Qualcomm Incorporated 4X4 transform for media coding
US9081733B2 (en) 2009-06-24 2015-07-14 Qualcomm Incorporated 16-point transform for media data coding
US9075757B2 (en) 2009-06-24 2015-07-07 Qualcomm Incorporated 16-point transform for media data coding
US9118898B2 (en) 2009-06-24 2015-08-25 Qualcomm Incorporated 8-point transform for media data coding
TWI402771B (zh) * 2009-12-24 2013-07-21 Univ Nat Central 應用於多核心處理器之快速整數離散餘弦轉換方法
US8639059B2 (en) * 2010-02-10 2014-01-28 Andrew Batrac Method for lossless digital shearing and rotation with fine angular increments
US8527649B2 (en) 2010-03-09 2013-09-03 Mobixell Networks Ltd. Multi-stream bit rate adaptation
JP5546329B2 (ja) * 2010-04-14 2014-07-09 キヤノン株式会社 データ変換装置
JP5520122B2 (ja) 2010-04-14 2014-06-11 キヤノン株式会社 データ変換装置
US8832709B2 (en) 2010-07-19 2014-09-09 Flash Networks Ltd. Network optimization
US8995532B2 (en) * 2010-09-30 2015-03-31 Texas Instruments Incorporated Low complexity large transform
US9824066B2 (en) 2011-01-10 2017-11-21 Qualcomm Incorporated 32-point transform for media data coding
US20120183047A1 (en) 2011-01-18 2012-07-19 Louis Joseph Kerofsky Video decoder with reduced dynamic range transform with inverse transform clipping
US20120183048A1 (en) * 2011-01-18 2012-07-19 Louis Joseph Kerofsky Video decoder with reduced dynamic range transform with multiple clipping
US8688074B2 (en) 2011-02-28 2014-04-01 Moisixell Networks Ltd. Service classification of web traffic
KR101395143B1 (ko) * 2013-06-13 2014-05-21 이노뎁 주식회사 영상처리의 정수변환 방법 및 정수변환 장치
USRE48920E1 (en) * 2014-02-21 2022-02-01 Lattice Semiconductor Corporation Adaptive processing of video streams with reduced color resolution
WO2015134198A1 (en) * 2014-02-21 2015-09-11 Silicon Image, Inc. Adaptive processing of video streams with reduced color resolution
ITUB20155295A1 (it) * 2015-10-16 2017-04-16 Torino Politecnico Apparatuses and methods for encoding and decoding images
WO2020009619A1 (en) 2018-07-02 2020-01-09 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding
US11955227B2 (en) 2018-09-05 2024-04-09 Translational Imaging Innovations, Inc. Methods, systems and computer program products for retrospective data mining
WO2020055288A2 (en) 2018-09-16 2020-03-19 Huawei Technologies Co., Ltd. Apparatus and method for filtering in video coding with look-up table selected based on bitstream information
CN109858231B (zh) * 2019-01-22 2021-03-23 武汉极意网络科技有限公司 行为轨迹无损压缩编码方法、用户设备、存储介质及装置
CN110233626B (zh) * 2019-07-05 2022-10-25 重庆邮电大学 基于二维自适应量化的机械振动信号边缘数据无损压缩方法

Family Cites Families (53)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US582200A (en) * 1897-05-11 Telephone-transmitter
US4754492A (en) 1985-06-03 1988-06-28 Picturetel Corporation Method and system for adapting a digitized signal processing system for block processing with minimal blocking artifacts
US5297236A (en) 1989-01-27 1994-03-22 Dolby Laboratories Licensing Corporation Low computational-complexity digital filter bank for encoder, decoder, and encoder/decoder
JP2549479B2 (ja) 1991-12-06 1996-10-30 日本電信電話株式会社 動き補償フレーム間帯域分割符号化処理方法
KR0148130B1 (ko) 1992-05-18 1998-09-15 강진구 블럭킹아티팩트를 억제시키는 부호화/복호화 방법 및 그 장치
US5982459A (en) 1995-05-31 1999-11-09 8×8, Inc. Integrated multimedia communications processor and codec
FR2737931B1 (fr) 1995-08-17 1998-10-02 Siemens Ag Procede destine au traitement de blocs d'images decodes d'un procede de codage d'images a base de blocs
US5970173A (en) 1995-10-05 1999-10-19 Microsoft Corporation Image compression and affine transformation for image motion compensation
US6064776A (en) 1995-10-27 2000-05-16 Kabushiki Kaisha Toshiba Image processing apparatus
US5850294A (en) 1995-12-18 1998-12-15 Lucent Technologies Inc. Method and apparatus for post-processing images
KR100196838B1 (ko) 1995-12-23 1999-06-15 전주범 블럭벌 상관 관계에 의한 부호화 장치
US5805739A (en) 1996-04-02 1998-09-08 Picturetel Corporation Lapped orthogonal vector quantization
JP2907146B2 (ja) 1996-09-11 1999-06-21 日本電気株式会社 メモリlsiの特定箇所探索方法および探索装置
US5999656A (en) * 1997-01-17 1999-12-07 Ricoh Co., Ltd. Overlapped reversible transforms for unified lossless/lossy compression
US5973755A (en) 1997-04-04 1999-10-26 Microsoft Corporation Video encoder and decoder using bilinear motion compensation and lapped orthogonal transforms
US6101279A (en) 1997-06-05 2000-08-08 Wisconsin Alumni Research Foundation Image compression system using block transforms and tree-type coefficient truncation
US5859788A (en) 1997-08-15 1999-01-12 The Aerospace Corporation Modulated lapped transform method
US6393156B1 (en) 1998-01-07 2002-05-21 Truong Q. Nguyen Enhanced transform compatibility for standardized data compression
US6393061B1 (en) 1998-05-15 2002-05-21 Hughes Electronics Corporation Method for reducing blocking artifacts in digital images
US6029126A (en) 1998-06-30 2000-02-22 Microsoft Corporation Scalable audio coder and decoder
US6115689A (en) 1998-05-27 2000-09-05 Microsoft Corporation Scalable audio coder and decoder
US6073153A (en) 1998-06-03 2000-06-06 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6154762A (en) 1998-06-03 2000-11-28 Microsoft Corporation Fast system and method for computing modulated lapped transforms
US6253165B1 (en) 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
US6011625A (en) 1998-07-08 2000-01-04 Lockheed Martin Corporation Method for phase unwrapping in imaging systems
US6421464B1 (en) * 1998-12-16 2002-07-16 Fastvdo Llc Fast lapped image transforms using lifting steps
US6487574B1 (en) 1999-02-26 2002-11-26 Microsoft Corp. System and method for producing modulated complex lapped transforms
US6496795B1 (en) 1999-05-05 2002-12-17 Microsoft Corporation Modulated complex lapped transform for integrated signal enhancement and coding
US6587588B1 (en) * 1999-03-16 2003-07-01 At&T Corp. Progressive image decoder for wavelet encoded images in compressed files and method of operation
US6370502B1 (en) 1999-05-27 2002-04-09 America Online, Inc. Method and system for reduction of quantization-induced block-discontinuities and general purpose audio codec
US6771829B1 (en) 1999-10-23 2004-08-03 Fastvdo Llc Method for local zerotree image coding
US6865229B1 (en) 1999-12-14 2005-03-08 Koninklijke Philips Electronics N.V. Method and apparatus for reducing the “blocky picture” effect in MPEG decoded images
US6771828B1 (en) 2000-03-03 2004-08-03 Microsoft Corporation System and method for progessively transform coding digital data
WO2002007438A1 (en) 2000-07-17 2002-01-24 Trustees Of Boston University Generalized lapped biorthogonal transform embedded inverse discrete cosine transform and low bit rate video sequence coding artifact removal
JP2004509531A (ja) 2000-09-12 2004-03-25 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化方法
JP2002304624A (ja) * 2001-04-05 2002-10-18 Canon Inc フィルタ処理装置及び撮像装置
US6882685B2 (en) 2001-09-18 2005-04-19 Microsoft Corporation Block transform and quantization for image and video coding
JP2003141562A (ja) * 2001-10-29 2003-05-16 Sony Corp 非平面画像の画像処理装置及び画像処理方法、記憶媒体、並びにコンピュータ・プログラム
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
US6763068B2 (en) 2001-12-28 2004-07-13 Nokia Corporation Method and apparatus for selecting macroblock quantization parameters in a video encoder
JP2003283840A (ja) * 2002-03-25 2003-10-03 Canon Inc フィルタ処理装置およびフィルタ処理方法
US7006699B2 (en) 2002-03-27 2006-02-28 Microsoft Corporation System and method for progressively transforming and coding digital data
US7155065B1 (en) 2002-03-27 2006-12-26 Microsoft Corporation System and method for progressively transforming and coding digital data
JP3855827B2 (ja) * 2002-04-05 2006-12-13 ソニー株式会社 2次元サブバンド符号化装置
US7275036B2 (en) 2002-04-18 2007-09-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for coding a time-discrete audio signal to obtain coded audio data and for decoding coded audio data
US7242713B2 (en) 2002-05-02 2007-07-10 Microsoft Corporation 2-D transforms for image and video coding
US7376280B2 (en) * 2002-07-14 2008-05-20 Apple Inc Video encoding and decoding
US6728315B2 (en) 2002-07-24 2004-04-27 Apple Computer, Inc. Method and apparatus for variable accuracy inter-picture timing specification for digital video encoding with reduced requirements for division operations
US7227901B2 (en) 2002-11-21 2007-06-05 Ub Video Inc. Low-complexity deblocking filter
US7167522B2 (en) 2003-02-27 2007-01-23 Texas Instruments Incorporated Video deblocking filter
US7471726B2 (en) 2003-07-15 2008-12-30 Microsoft Corporation Spatial-domain lapped transform in digital media compression
US8374238B2 (en) * 2004-07-13 2013-02-12 Microsoft Corporation Spatial scalability in 3D sub-band decoding of SDMCTF-encoded video
US7305139B2 (en) 2004-12-17 2007-12-04 Microsoft Corporation Reversible 2-dimensional pre-/post-filtering for lapped biorthogonal transform

Also Published As

Publication number Publication date
CA2526762A1 (en) 2006-06-17
JP2006197572A (ja) 2006-07-27
AU2005237142A1 (en) 2006-07-06
BRPI0506084A8 (pt) 2016-10-04
MXPA05012403A (es) 2006-06-19
KR101036731B1 (ko) 2011-05-24
CN1791222B (zh) 2012-08-15
US7471850B2 (en) 2008-12-30
EP1672517B1 (en) 2018-08-29
BRPI0506084A (pt) 2006-09-19
CN1791222A (zh) 2006-06-21
EP1672517A2 (en) 2006-06-21
AU2005237142B2 (en) 2009-11-05
RU2413983C2 (ru) 2011-03-10
RU2005135847A (ru) 2007-05-27
CA2526762C (en) 2013-05-21
KR20060069254A (ko) 2006-06-21
EP1672517A3 (en) 2012-03-07
BRPI0506084B1 (pt) 2019-04-09
US20060133683A1 (en) 2006-06-22

Similar Documents

Publication Publication Date Title
JP4874642B2 (ja) ロッシーおよびロスレス2dデータ圧縮のための可逆な変換
JP4425561B2 (ja) イメージおよびビデオ符号化のための2−d変換
RU2460129C2 (ru) Структура преобразования с масштабированными и немасштабированными интерфейсами
RU2427910C2 (ru) Кодирование/декодирование цифрового мультимедиа на основе перекрывающегося simd-преобразования
KR101507183B1 (ko) 변환-기반 디지털 미디어 코덱에서의 계산 복잡도 및 정밀도 제어
JP4425824B2 (ja) 動画像コーデック変換の高速実装
JP5113067B2 (ja) 信号およびデータ処理のための効率的な無乗算計算
KR100331136B1 (ko) 멀티미디어정보용역코사인변환함수를수행하는컴퓨터시스템
MX2008008987A (es) Transformadas con factores comunes.
US7613761B2 (en) Haar wavelet transform embedded lossless type II discrete cosine transform
US7379500B2 (en) Low-complexity 2-power transform for image/video compression
US7805476B2 (en) Extended Haar transform
US7640283B2 (en) Shared Haar wavelet transform
Wahid Error-free Algorighms and Architectures of Discrete Cosine Transforms Using Multidimensional Algebraic Interger Quantization

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110408

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110707

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110712

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110908

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110913

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20111007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20111118

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20111124

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20141202

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4874642

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees