JP2009505496A - 画像圧縮に関する変換係数の予測 - Google Patents

画像圧縮に関する変換係数の予測 Download PDF

Info

Publication number
JP2009505496A
JP2009505496A JP2008526092A JP2008526092A JP2009505496A JP 2009505496 A JP2009505496 A JP 2009505496A JP 2008526092 A JP2008526092 A JP 2008526092A JP 2008526092 A JP2008526092 A JP 2008526092A JP 2009505496 A JP2009505496 A JP 2009505496A
Authority
JP
Japan
Prior art keywords
block
coefficient
dominant
dcac
macroblock
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2008526092A
Other languages
English (en)
Other versions
JP5065272B2 (ja
Inventor
シュリニヴァサン シュリダール
チェンジィエ ツ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Microsoft Corp
Original Assignee
Microsoft Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Microsoft Corp filed Critical Microsoft Corp
Publication of JP2009505496A publication Critical patent/JP2009505496A/ja
Application granted granted Critical
Publication of JP5065272B2 publication Critical patent/JP5065272B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/105Selection of the reference unit for prediction within a chosen coding or prediction mode, e.g. adaptive choice of position and number of pixels used for prediction
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • H04N19/122Selection of transform size, e.g. 8x8 or 2x4x8 DCT; Selection of sub-band transforms of varying structure or type
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Discrete Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Color Television Systems (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)

Abstract

ブロック変換ベースのデジタルメディアコーデックは、デジタルメディアデータの支配的な方向性(例えば、強い水平方向または垂直方向の特性を有するイメージ)を考慮した変換係数予測を使用し、さらに2段階の変換と互換性を持って動作する。マクロブロックの内部段階変換からのDCおよびDCAC係数に対して、コーデックは隣接マクロブロックの内部段階変換DC係数に基づいて方向性メトリックを計算および比較して支配的な方向性を決定する。マクロブロック内部のブロックの外部段階変換からのDCAC係数に対し、コーデックはマクロブロックの内部段階変換DCAC係数に基づいて方向性メトリックを計算および比較して支配的な方向性を検出する。方向支配の決定では、他のチャネル(例えば、クロミナンスおよび輝度)からの情報を考慮することもできる。

Description

本発明は画像圧縮の分野に関する。より詳細には、本発明は画像圧縮に関する変換係数の予測に関する。
ブロック変換ベースの符号化
変換符号化は、多数のオーディオ、イメージおよびビデオ圧縮システムで使用される圧縮技術である。未圧縮のデジタルイメージおよびビデオは一般に、2次元(2D)グリッドに配置したイメージ内またはビデオフレーム内の位置での画素サンプルまたは色サンプルとして表現または捉えられる。これはイメージまたはビデオの空間領域表現と呼ばれる。例えば、イメージの一般的な形式は、グリッドとして配置した24ビット色の画素サンプルのストリームから成る。夫々のサンプルは、とりわけRGBまたはYIQなどの色空間内部のグリッドにおける画素位置での色成分を表す数字である。様々なイメージおよびビデオシステムは様々な色、サンプリングの時空間解像度を使用することができる。同様に、デジタルオーディオは一般に、時間サンプリングしたオーディオ信号ストリームとして表される。例えば、一般的なオーディオフォーマットは、一定時間間隔で取得したオーディオ信号の16ビット振幅サンプルのストリームから成る。
従来のビデオ圧縮は、最初のイメージフレームを圧縮し、連続したフレーム間の差分を圧縮することで実施される。本プロセスはビデオシーケンスに渡って周期的に反復される。従って、ビデオ圧縮は“静的”イメージの圧縮に密接に関連する。
未圧縮のデジタルオーディオ、イメージおよびビデオ信号は多量の記憶および送信容量を消費する可能性がある。変換符号化は、信号の空間領域表現を周波数領域(または他の同様な変換領域)表現に変換することでデジタルオーディオ、イメージおよびビデオのサイズを削減し、次いで変換領域表現の一定の一般にやや不可視な周波数成分の解像度を減少させる。これにより一般に、空間領域におけるイメージまたはビデオの色または空間解像度の減少、または時間領域におけるオーディオの色または空間解像度の減少と比較して、デジタル信号の認識可能な劣化が非常に少なくなる。
より詳細には、図1に示す典型的なブロック変換ベースのコーデック100は未圧縮のデジタルイメージの画素を固定サイズの2次元ブロック(X1,...Xn)に分割する。夫々のブロックは他のブロックと重複する可能性がある。空間周波数分析を行う線形変換120−121を夫々のブロックに適用する。線形変換120−121はブロック内部の間隔の空いたサンプルを、周波数(または変換)係数の集合に変換する。当該集合は一般に、ブロック間隔上で対応する周波数帯におけるデジタル信号強度を表す。圧縮のため、変換係数を選択的に量子化130(即ち、例えば係数値の最下位ビットを落とすかまたは高解像度の数の集合における値を低解像度にマッピングすることで、解像度を削減)することができ、圧縮データストリームにエントロピーまたは可変長符号化130することもできる。復号化の際は、変換係数を逆変換170−171して、元の色/空間サンプルイメージ/ビデオ信号を近似的に再構築する。再構築ブロックは以下のように表される。
Figure 2009505496
ブロック変換120−121を、大きさNのベクトルx上の数学的操作として定義することができる。ほとんどの場合この操作は線形乗算(linear multiplication)であり、Mを変換行列とすると、変換領域の出力y=Mxが得られる。入力データが任意長のとき、当該入力データをサイズNのベクトルに分割し、ブロック変換を夫々のセグメントに適用する。データ圧縮の目的で可逆ブロック変換が選択される。換言すれば、行列Mは可逆である。多次元(例えば、イメージおよびビデオ)ではブロック変換は一般に別々の操作として実装される。行列乗算は、夫々のデータ次元(即ち、行および列の両方)に沿って別々に適用される。
圧縮のため、変換係数(ベクトルyの成分)を選択的に量子化(即ち、例えば係数値の最下位ビットを落とすかまたは高解像度の数の集合における値を低解像度にマッピングすることで、解像度を削減)することができ、圧縮データストリームにエントロピーまたは可変長符号化することもできる。
デコーダ150での復号化の際、図1に示すように、これらの操作の逆(逆量子化/エントロピー復号化160および逆ブロック変換170−171)がデコーダ150側で適用される。データの再構築中に、逆行列M-1(逆変換170−171)が乗算器として変換領域データに適用される。変換領域データに適用すると、逆変換により元の時間領域または空間領域のデジタルメディアが近似的に再構築される。
多数のブロック変換ベース符号化の適用において、量子化係数に依存して非可逆圧縮および可逆圧縮の両方をサポートするため変換は可逆であることが望ましい。例えば量子化無し(一般には、量子化係数1として表される)の場合、可逆変換を利用するコーデックは復号時に入力データを完全に再生することができる。しかしながら、これらの適用における可逆性の要件により、コーデックを設計することによって変換の選択が制限される。
とりわけMPEGおよびWindows(登録商標) Mediaなどの多数のイメージおよびビデオ圧縮システムは離散コサイン変換(DCT)に基づく変換を利用する。DCTは、ほぼ最適なデータ圧縮となる好ましいエネルギー圧縮特性を有するとして知られている。これらの圧縮システムでは、逆DCT(IDCT)を圧縮システムのエンコーダおよびデコーダの両方における再構築ループで使用して、個々のイメージブロックを再構築する。
米国特許出願公開第2006/133683号明細書 米国特許出願公開第2006/133682号明細書 米国特許出願公開第2006/133684号明細書
変換係数の予測
今述べたように、ブロック変換は一般に離散コサイン変換(DCT)またはその変形を使用する。損失が高レベルになると、ブロック変換は厄介なブロック不連続性による視覚的アーチファクト(visual artifact)を免れない。変換ウィンドウが重複する“重複変換”技術を使用して、再構築したものを損失下でも平滑化することができる。
ブロック変換および重複変換の両方において、水平および垂直方向に沿って配向する長線形な特徴は、変換領域ブロックの左端または上端に沿った高い変換値の原因となる。前述の左端および上端はDCAC値と呼ばれることがよくある。この名前の理由は、これらが一方の方向ではDCであり他方の方向ではACである係数であるからである。左上位置はDC値(両方向でDC)と呼ばれる。
ブロック変換はブロック間の相関を示すことがよくある。隣接ブロックのDC係数は相関し、確率的な意味で閉じる傾向があることは容易に理解することができる。隣接ブロックの対応するDCAC係数間の相関は、それ程明確ではない。とりわけイメージの或る特定の領域が(線またはパターンのような)強い水平方向の特性を示す場合、水平方向ではDCであり垂直方向ではACである変換係数は同様にブロック間の数的相関を示す。
隣接ブロックからDCおよびDCAC項を予測すること、および予測誤差を符号化することによるブロック間のDCおよびDCAC連続性を利用するプロセスは、一般に“DCAC予測”と呼ばれる。本用語は、元の(または近似的な)DCおよびDCAC変換係数を回復するデコーダ側のプロセスも網羅する。予測したDCAC項は全てのDCAC項のサブセットであることができ、予測方向により決定される。
デジタルメディア符号化および復号化技術と本明細書で説明したデジタルメディアコーデックにおける技術を具現化したものとは、デジタルメディアデータの支配的な方向性(例えば、強い水平方向または垂直方向の特性を有するイメージ)を考慮した変換係数予測を使用し、さらに2段階の変換と互換性をもって動作する。
マクロブロックの内部段階変換(inner stage transform)で得たDCおよびDCAC係数に対し、コーデックは隣接マクロブロックの内部段階変換DC係数に基づいて方向性メトリックを計算および比較して、支配的な方向性を決定する。方向支配の決定では、他のチャンネル(例えば、色またはクロミナンス)からの情報も考慮することができる。方向支配がない場合、マクロブロックのDC係数は先行隣接マクロブロックのDC係数の平均から予測する。隣接マクロブロックが異なる量子化器を有する場合、マクロブロックのDCAC係数に対する方向予測を飛ばしても良い。または、DCAC係数の方向予測を、同一の量子化器を有する1または複数のマクロブロックに限定してもよい。
マクロブロック内部のブロックの外部段階変換(outer stage transform)で得たDCAC係数に対して、コーデックはマクロブロックの内部段階変換DCAC係数に基づいて方向性メトリックを計算および比較して、支配的な方向性を検出する。方向支配の決定では、他のチャネル(例えば、色またはクロミナンス)からの情報も考慮することができる。このように外部段階DCAC係数に対して方向予測を決定することを、マクロブロック内の情報にのみ基づいて行うことができる。方向支配を発見した場合、マクロブロック内部のブロックの外部段階DCAC係数を、支配的な方向から単方向に予測する。
本要約は、選択性のある概念を簡潔な形で導入するために与えた。これら概念は以下でさらに説明する。本要約は特許請求の範囲の主題の主要な特徴または本質的な特徴を特定するようには意図しておらず、特許請求の範囲の主題の範囲を決定するための支援として使用するようにも意図していない。
以下の説明は、係数予測に基づくブロック変換ベースのコーデックの効率的な変換係数の符号化/復号化(本明細書では、“予測変換係数符号化”と称する)を与える、符号化および復号化技術に関する。以下の説明は、前述の技術の実装例をデジタルメディアの圧縮システムまたはコーデックのコンテクストで説明する。デジタルメディアシステムはデジタルメディアデータを送信用または記憶用に圧縮形態で符号化し、該データを再生用または他の処理用に復号化する。説明のため、この予測変換係数符号化を組み込んだこの例示的な圧縮システムはイメージまたはビデオ圧縮システムである。または、前述の技術を他の2Dデータに対する圧縮システムまたはコーデックに取り込むこともできる。予測変換係数符号化技術は、デジタルメディア圧縮システムが圧縮デジタルメディアデータを特定の符号化形式でエンコードすることを要求しない。
1.エンコーダ/デコーダ
図2および図3は代表的な2次元(2D)データのエンコーダ200およびデコーダ300で利用するプロセスの一般的な図である。図2および図3はブロックパターン符号化を実装する2Dデータエンコーダおよびデコーダを組み込んだ圧縮システムの一般的または簡単な説明を表す。ブロックパターン符号化を用いる代替的な圧縮システムでは、2Dデータ圧縮に対して、この代表的なエンコーダおよびデコーダで示したものよりも多いプロセスまたは少ないプロセスを使用することができる。例えば、幾つかのエンコーダ/デコーダは色変換、カラーフォーマット、スケーラブル符号化、可逆符号化、マクロブロックモード、等を含むことができる。圧縮システム(エンコーダおよびデコーダ)は可逆から非可逆へ変化する量子化パラメータに基づく量子化に依存して、2Dデータの可逆および/または非可逆圧縮を与えることができる。
2Dデータエンコーダ200は、エンコーダへの入力として(典型的な入力に対して)よりコンパクトな2Dデータ210の表現である圧縮ビットストリーム220を生成する。例えば2Dデータ入力はイメージ、ビデオシーケンスのフレーム、または2つの次元を有する他のデータであることができる。2Dデータエンコーダは入力データをマクロブロックにタイルする(230)。前述のマクロブロックは、この代表的なエンコーダではサイズが16×16の画素である。2Dデータエンコーダはさらに夫々のマクロブロックを4×4のブロックにタイルする。ブロック変換250を用いて夫々の4×4ブロックを変換した後に、“前方重ね合わせ(forward overlap)”演算子240をブロック間の夫々の縁に適用する。このブロック変換250は、Srinivasanによる2004年12月17日出願の“ロッシーおよびロスレス2Dデータ圧縮のための可逆な変換”というタイトルの米国特許出願11/015,707(特許文献1)で説明される、可逆でスケールフリーな2D変換であることができる。重ね合わせ演算子240は、Tuらによる2004年12月17日出願の“効率的な損失なしデータ圧縮のための可逆重ね合わせ演算子”というタイトルの米国特許出願番号11/015,148(特許文献2)、およびTuらによる2005年1月14日出願の“重ね合わせ双直交変換のための可逆2次元プリ/ポストフィルタリング”というタイトルの米国特許出願番号11/035,991(特許文献3)で説明される、可逆重ね合わせ演算子であることができる。または、離散コサイン変換または他のブロック変換および重ね合わせ演算子を使用することができる。変換に続いて、夫々の4×4変換ブロックのDC係数260は同様な処理連鎖(タイリング、前方重ね合わせ、4×4ブロック変換)を受ける。結果のDC変換係数およびAC変換係数を量子化し(270)、エントロピー符号化して(280)パケット化(290)する。
デコーダは逆のプロセスを実施する。デコーダ側では、変換係数のビットをそれらの夫々のパケットから抽出310する。前述の夫々のパケットから、係数自身が復号化320および逆量子化330される。DC係数340を逆変換の適用により再生し、DCブロック端に渡って適用した適切な平滑化演算子を用いてDC係数平面(plane)を“逆に重ね合わせ”する。引き続いて、4×4の逆変換350をDC係数に適用することでデータ全体を再生し、AC係数342をビットストリームから復号化する。最後に結果のイメージ平面内のブロック端を逆重ね合わせフィルタする(360)。これにより2Dデータ出力が再構築される。
例示的な実装において、エンコーダ200(図2)は入力イメージを圧縮ビットストリーム220(例えば、ファイル)に圧縮し、デコーダ300(図3)は元の入力またはその近似を、可逆または非可逆符号化のどちらを採用するかに基づいて、再構築する。符号化プロセスは以下で議論する前方重ね合わせ変換(LT)の適用を含む。前方重ね合わせ変換(LT)は、やはり以下で詳述する可逆2次元プリ/ポストフィルタリングで実装される。復号化プロセスは、可逆2次元プリ/ポストフィルタリングを用いた逆重ね合わせ変換(ILT)の適用を含む。
説明したLTおよびILTは正確な意味で互いに逆であり、従って集合的に可逆重ね合わせ変換と呼ぶことができる。可逆変換として、LT/ILTの組を無損失画像圧縮に使用することができる。
説明したエンコーダ200/デコーダ300により圧縮した入力データ210は、様々なカラーフォーマット(例えば、RGB/YUV4:4:4、YUV4:2:2またはYUV4:2:0のカラーイメージフォーマット)のイメージであることができる。一般に入力イメージは常に輝度(Y)成分を有する。入力イメージがRGB/YUV4:4:4、YUV4:2:2またはYUV4:2:0のイメージの場合、該イメージは、U成分およびV成分のようなクロミナンス成分も有する。イメージの別個の色平面または成分は異なる空間解像度を有することができる。例えばYUV4:2:0カラーフォーマットにおける入力イメージの場合、U成分およびV成分はY成分の半分の幅と高さを有する。
上述のように、エンコーダ200は入力イメージまたは画像をマクロブロックにタイルする。例示的な実装では、エンコーダ200は入力イメージをYチャネルにおける16×16のマクロブロック(カラーフォーマットによってUチャネルおよびVチャネルにおける16×16、16×8、または8×8の領域でありうる)にタイルする。夫々のマクロブロックの色平面は4×4の領域またはブロックにタイルされる。従って、マクロブロックは、この例示的なエンコーダの実装において以下のように様々なカラーフォーマットに対して構成される。
1.グレースケールのイメージに対して、夫々のマクロブロックは16個の4×4輝度(Y)ブロックを含む。
2.YUV4:2:0フォーマットのカラーイメージに対し、夫々のマクロブロックは16個の4×4のYブロックを含み、夫々4個の4×4のクロミナンス(UおよびY)ブロックを含む。
3.YUV4:2:2フォーマットのカラーイメージに対し、夫々のマクロブロックは16個の4×4のYブロックを含み、夫々8個の4×4のクロミナンス(UおよびY)ブロックを含む。
4.RGBまたはYUV4:4:4のカラーイメージに対し、夫々のマクロブロックは夫々16個のブロックのY、UおよびVチャネルを含む。
図4、5および6は、代表的なエンコーダ/デコーダにおける様々な変換ブロックの例を示す。図4は様々なフォーマットの輝度チャネル内ブロック、およびYUV4:4:4カラーフォーマットイメージのクロミナンスチャネル内ブロックに対する4×4の変換ブロックを示す。図5は422クロマ(chroma)ローパスブロックフォーマットを示す。422クロマローパスブロックは、YUV422カラーフォーマットイメージのクロマチャネルの内部段階変換で得た変換ブロック係数を含む。図6は420クロマローパスブロックを示す。420クロマローパスブロックはYUV4:2:0カラーフォーマットイメージのクロマチャネルの内部段階変換で得た係数を含む。
図4を参照する。以下の説明は、順序付けられた基底関数を用いた、行列表記と一致するブロック変換の慣習または表記法を使用する。例えば図4に示す変換係数ブロック400において、DC周波数を表す係数は(係数「0」とラベル付けされた)変換係数ブロックの最初の行/列であり、最高AC周波数の係数は(係数「15」とラベル付けされた)最後の行/列である。さらに、ブロックの上端行におけるDCAC係数(図4内で、「1」、「2」、「3」とラベル付けした係数)は垂直線のパターンに対応し、左の列内のDCAC値(図4内で「4」、「8」および「12」とラベル付けした係数)は水平線のパターンに対応する。実際の現実的な実装では、変換ブロックを転置することができ、この場合適切な係数の再インデックス化を考慮しなければならない。
2.予測変換係数符号化の概要
[背景技術]の段落において簡潔に上述したように、DCAC予測は、隣接ブロックからDCおよびDCAC項を予測すること、および予測誤差を符号化する(およびデコーダ側での逆のプロセスを行う)ことでブロック間のDCおよびDCAC連続性を利用するプロセスである。
図7および8を参照し、DCAC予測の例を示す。本例では、DC係数(「0」)および夫々の変換ブロックの垂直パターン(「1」、「2」、および「3」)または水平パターン(「4」、「8」、および「12」)のいずれかに対応するDCAC係数の集合を、先行する隣接ブロックのものから予測する。換言すれば、隣接ブロックの対応する係数を、カレントブロックのものに対する“予測因子(predictor)”として捉える。本例の夫々のブロックに対する予測方向は図8の図(記号「N」は予測無しを示し、「L」は左予測を示し、「T」は上予測を示す)で識別し、図7の図の矢印で示す。予測方向が上からのとき、係数「1」、「2」、および「3」はブロック内の対応する係数から上方向に予測される。予測方向が左からのとき、係数「4」、「8」、および「12」はブロック内の対応する係数から左方向に予測される。特に、左上のブロックに対しては予測を行わない。上端行の第2および第3のブロックは、該ブロックからそれらの左に向かって予測する。第2行におけるブロックは上から夫々、左および上に予測する。DCAC予測によりエンコーダは係数を、その予測因子からの差分として符号化する。予測が合理的に正確である場合、予測因子からの差分は高い確率で零であり、エントロピー符号化280(図2)において、可変長エントロピー符号化技術(例えばランレングス符号化)で効率的に符号化することができる。例えば可変長エントロピー符号化技術は、Srinivasanによる2005年8月12日出願の“変換ブロックの効率的な符号化および復号化”というタイトルの米国特許出願番号TBDで説明されている。
上の代表的なエンコーダ200(図2)およびデコーダ(図3)には、DCAC予測の使用上或る難点がある。第1に、代表的なエンコーダおよびデコーダは2段階の変換を使用する。これらを「外部」および「内部」段階と呼ぶことができ、それらは夫々高域帯および低域帯に対応する。特に、ブロックのDC係数260(図2)は第2段階の変換(「内部」段階)を受ける。結果として、最初にその段階の逆変換を実施せずにデコーダがDC係数を利用して他の係数を復号することはできない。
第2に、代表的なエンコーダおよびデコーダは重ね合わせ変換を使用する。その設計および構築により、重ね合わせ変換は隣接ブロックに渡る連続性を既に暗黙的に抽出している。この理由により、DCAC予測をさらに適用すると、(DCAC予測がない場合と比較して)結果として符号化性能が劣化する可能性がある。
第3に、メモリフットプリントと複雑性を最小化する目的で、マクロブロック間DCAC予測を最小に保つことが望ましい。
最後に、代表的なエンコーダおよびデコーダは異なる量子化器を異なるマクロブロック内で適用する可能性があり、これによりDCAC予測がさらに複雑になる。
本明細書で説明した予測変換係数符号化技術により、従来のDCAC予測に対して様々な拡張が与えられる。特に以下で説明する予測変換係数符号化技術の例示的な実装により、一意な予測規則集合を用いて、上で列挙した問題が対処される。要約すると、これらの規則には以下が含まれる。
1.(内部変換の)DC係数を、利用可能ならば色情報に少なくとも部分的に基づいて因果的隣接ブロックから得たDC係数に基づいて予測する。
2.内部変換のDCAC係数はDC係数のものから導出した予測方向を使用し、マクロブロック外の情報にも依存する。
3.カレントマクロブロックおよび先行マクロブロックが異なる量子化器を有するとき、内部変換のDCAC係数の予測はスキップされる(即ち、予測因子として0を用いる)。
4.外部変換DCAC係数の予測は、純粋にマクロブロック内部で実施する。
5.外部変換DCAC係数の予測方向は、同一マクロブロックの内部変換のDCAC係数から導出する。
以下の説明では、予測変換係数符号化は、量子化変換係数(例えば、図2のエンコーダ200内での量子化270後、および図3のデコーダ300内での逆量子化330前の変換係数)上で実施されるものとして説明する。しかしながら、予測変換係数符号化技術の代替的な実装は、未量子化変換係数(または、デコーダ側での逆量子化値)上で実施してもよいことは理解されるべきである。
代表的なエンコーダ/デコーダにおける予測変換係数符号化には、以下のセクションで詳述する3つの予測レベルが含まれる。これらには以下のものが含まれる。
1.DC予測。これは内部変換のDC係数の予測である。
2.ローパスDCAC予測。これは内部変換のDCAC係数の予測である。
3.ハイパスDCAC予測。これは外部変換のDCAC係数の予測である。
2.1 DC予測
上述のように、代表的なエンコーダ200(図2)はイメージを16×16の画素のマクロブロックにタイルし、さらにマクロブロックを夫々が4×4の画素である変換ブロックにタイルする。外部段階変換を変換ブロックに適用し、図4に示す4×4の変換係数を含むブロックを(輝度チャネル、およびYUV4:4:4カラーフォーマットイメージのクロミナンスチャネルに対して)生成する。マクロブロックのこれら16個の変換係数ブロックにおけるDC係数を分離し(4×4のブロックを形成)、内部段階変換を本ブロックに適用する。その結果の内部段階変換ブロックは、再度4×4の係数を有する。本内部段階変換ブロックのDC係数(「0」とラベル化)を、本明細書ではマクロブロックのDC係数と称する。内部段階変換ブロックのDCAC係数(「1」、「2」、「3」、「4」、「8」および「12」)を、本明細書ではマクロブロックのローパスDCAC係数と称する。本マクロブロック構造は、予測変換係数符号化を利用する代替的なエンコーダおよびデコーダでは変化することができる。
マクロブロックの係数を符号化するとき、予測変換係数符号化はマクロブロックのDC係数に対する下記の4つの予測モードから選択する。
1.左からの予測(即ち、マクロブロックのDC係数に対する予測因子は、その左へのマクロブロックのDC係数であるか、またはpredictor=DC[left_MB]である。)
2.上からの予測(即ち、予測因子はその上方へのマクロブロックのDC係数であるか、またはpredictor=DC[top_MB]である。
3.左および上からの予測(即ち、予測因子はその左および上方へのマクロブロックのDC係数の平均であるか、またはpredictor=DC[left_MB]+ DC[top_MB]/2である。
4.Nullの予測(即ち、予測なし。predictor=0)。
エンコーダは、図10の擬似コードリスト1000が示す手順に従ってどの予測モードをマクロブロックに対して使用すべきかを決定する。リスト1000では、値[mx,my]は、[0,0]にある左上のマクロブロックから始まる水平方向(x)および垂直方向(y)のマクロブロックのオフセット数で示した、イメージ(または、タイリングを用いる場合はイメージタイル)内のカレントマクロブロックのインデックスである。
示した手順において、エンコーダはイメージ内部のマクロブロックの位置に基づき、ならびにマクロブロックの左上および最上部左方に対するマクロブロックのDC係数を考慮して、どのDC予測モードを使用すべきかを決定する。より詳細には、エンコーダはイメージの最上部左方のマクロブロック(即ち、カレントマクロブロック[mx,my]=[0,0])に対して予測無しモードを選択する。エンコーダは、イメージ内の左端に沿うマクロブロック(即ち、インデックス(mx)が0の場合)に対して上予測を選択する。エンコーダは、イメージ内のマクロブロックの最上部行におけるマクロブロック(即ち、インデックス(my)が0の場合)に対して左予測を選択する。
全ての他の(例えば、イメージの内部にあるもの)マクロブロックに対して、エンコーダは支配的な方向性のメトリックに基づいて、使用すべき予測モードを決定する。例えば、水平方向のストライプを有するイメージ領域は水平方向に支配的な方向性を有する。換言すれば、カレントマクロブロックの水平近傍は、その垂直近傍よりもDC係数の良好な予測因子である。図9に示すように、カレント(X)のマクロブロックの左(L)および最上部(T)近傍のDC係数の、カレントマクロブロックの対角近傍(D)からの方向差分に基づいて本メトリックを計算する。イメージが色またはクロミナンスチャネルを有する場合(例えば、YUVカラーフォーマットイメージに対しては有するが、グレースケールイメージに対しては有さない場合)、メトリックはクロミナンスチャネルの対応するマクロブロックのDC係数をさらに考慮することもできる。実際には、前述の手順は、対角近傍のDC係数が左近傍のDC係数に対してかなり近い場合に垂直方向の支配的な方向性があることを決定する。他方、対角近傍のDC係数が最上部近傍のDC係数に対してかなり近いときに、メトリックは水平方向の支配的な方向性を示す。メトリックは重み係数(orient_weight)に基づいて「支配性」を決定する。示した手順において、この重み係数は4である。換言すれば、或る方向の方向差分が他の方向の方向差分の4倍より大きいとき、その方向は支配的であると見なされる。ただし、重み係数は代替的な実装では異なる値に設定可能なパラメータである。
水平方向にも垂直方向にも支配性がない場合、エンコーダは左および上予測モードの組合せ(上記リストの3番目)を選択する。この場合、予測因子は上および左のマクロブロックのDC係数の平均である。
2.2 ローパスDCAC予測
図2および4を再度参照する。代表的なエンコーダ200には第2または内部段階変換が含まれる。前述の変換は、外部段階変換からのDC係数260(図2)に適用される。結果の係数ブロック400の(位置「1」、「2」、「3」、「4」、「8」および「12」にある)DCAC係数(図4)を本明細書ではローパスDCAC係数と称する。
代表的なエンコーダおよびデコーダは、マクロブロックの内部段階変換で得たローパスDCAC係数の予測に対して下記の3つの予測モードを使用する。
1.左からの予測(即ち、マクロブロックのローパスDCAC係数に対する予測因子は、対応する左へのマクロブロックのDCAC係数であるか、またはpredictor=DCAC[left_MB]である)。この場合、「4」、「8」および「12」と印付けした係数のみを予測する。
2.上からの予測(即ち、予測因子は、対応する上方へのマクロブロックのローパスDCAC係数であるか、またはpredictor=DCAC[top_MB]である。この場合、‘1’、‘2’および‘3’と印付けした係数のみを予測する。および
3.Nullの予測(予測無し、またはpredictor=0)。
エンコーダは、図11の擬似コードリスト1100が示す手順に従ってどの予測モードをマクロブロックに対して使用すべきかを決定する。示した手順では、エンコーダはマクロブロックのDC予測モードに基づいてどのローパスDCAC予測モードを使用するかを決定し、カレントマクロブロックの量子化器インデックスとDC予測因子であるマクロブロックの量子化器インデックスとを決定する。本規則により、異なる量子化器を有するマクロブロックに渡って内部変換DCAC係数の予測が発生しないことが保証される。さらに、DCACは或る方向が支配的な場合にのみ予測され、上述のDC予測モード手順毎に導出される(即ち、水平方向または垂直方向の支配性が発見されるとき、DC予測モードは“左からの予測”または“上からの予測”である)。
図5を参照する。YUV4:2:2カラーフォーマットイメージに対するDCAC予測手順は、ブロック内の「5」とラベル付けした位置のローパスDCAC係数に対して特別な場合を有する。前述の特別な場合では、DCAC予測モードに関わらずDC予測モードが「上からの予測」であるとき、「5」とラベル付けした係数を係数「1」から予測する。
2.3 ハイパスDCAC予測
図2を再度参照する。2段階変換のため、代表的なエンコーダ/デコーダではハイパスDCAC係数に対する予測は複雑である。ハイパスDCAC係数は、外部段階変換250から生成したハイパス変換係数262の係数である。さらに、前述のように、逆量子化330(図3)の前に代表的なデコーダにおける予測が復号化320(図3)で行われるように、予測を代表的なエンコーダでの量子化270の後に実施する。復号化プロセスにおける本時点で、外部段階変換ブロックのDC係数を再構築するための逆内部段階変換は未実施である。同様に、エントロピー符号化280で、逆内部段階変換も実施しなければ外部段階DC係数260が利用できないように、代表的なエンコーダは既に内部段階変換を外部段階変換ブロックのDC係数260に適用している。従って、ハイパスDCAC予測の基礎を外部変換のDC係数260に置くことは望ましくない。そうでなければ、デコーダは同じ数値精度を有するように制限されるであろう。エンコーダはデコーダのループ(即ち逆内部段階変換)を実行するよう制限される。“オープンループ”ベースで動作するコーデックはこのループを実行できない。これらの理由により、代表的なエンコーダ/デコーダはハイパスDCAC予測符号化の基盤を、逆変換前の復号量子化値にのみ置く。
代表的なエンコーダ/デコーダの2段階変換は、ハイパス変換係数を復号化する前でも、カレントマクロブロックの性質に関する幾つかの情報を前もってローパス変換係数から知っていることができるという点で有利である。本情報を使用して、予測の方向性を決定する。代表的なエンコーダ/デコーダは、内部変換係数のみに基づいて、単純だが効率的なメトリックを使用してマクロブロックの支配的な方向性を決定する。
代表的なエンコーダおよびデコーダは、マクロブロックの外部段階変換からハイパスDCAC係数を予測するために下記の3つの予測モードを使用する。
1.左からの予測(即ち、図13のマクロブロック1300の左予測DCAC係数に対して説明したように、ブロックのハイパスDCAC係数に対する予測因子は、対応位置の左へのブロックのハイパスDCAC係数であるか、またはpredictor=DCAC[left_MB]である)。
2.上からの予測(即ち、図14のマクロブロック1400の上予測DCAC係数に対して説明したように、予測因子は、対応位置の上へのブロックのハイパスDCAC係数であるか、またはpredictor=DCAC[top_MB]である)。
3.Nullの予測(予測無し、またはpredictor=0)。
代表的なエンコーダ/デコーダでは、マクロブロック内予測が可能なマクロブロック内部の全てのブロックに同じモードを適用する(ただし、代替的な実装ではマクロブロック内の全てのブロックに同じモードを適用する必要はない)。換言すれば、「左からの予測」または「上からの予測」モードをマクロブロックに対して選択しても、マクロブロック内部に妥当な参照を有さないブロックのハイパスDCAC係数に対しては予測を行わない。
エンコーダは、図12の擬似コードリスト1200が示す手順に従ってどの予測モードをマクロブロックに対して使用すべきかを決定する。示した手順では、(図10のDC予測手順1000と同様に)重み係数を再度使用して方向支配を試験する。代表的なエンコーダおよびデコーダは重み係数の値を両方の手順に対して使用するが、代替的な実装では両方の手順で同じ値のパラメータを使用する必要はない。ハイパスDCAC予測手順1200における方向差分を、マクロブロックの内部段階変換からのローパスDCAC係数、および(存在すれば)クロミナンスチャネルからのローパスDCAC係数に基づいて計算する。擬似コードリスト1200において、値「lowpass[i]」は、図4に示すブロック構造にあるように左から右、上から下の順序でラベル付けした対応するインデックス(i)の位置にあるローパスDCAC係数である。値「lowpass_U[i]」および値「lowpass_V[i]」は、YUVカラーフォーマットイメージのUおよびVクロミナンスチャネルの内部段階変換ブロックで得たローパスDCAC係数である。これらのクロミナンスチャネルは、夫々YUV4:4:4、YUV4:2:2およびYUV4:2:0に対して図4,5および6で示したブロック構造400、500、および600にあるような係数インデックスを有する。
示したハイパスDCAC予測手順では、隣接マクロブロックの予測で使用するためマクロブロックから利用できるよう保持するのに必要な情報は、マクロブロックチャネル当たり1つのDC係数と6つのDCAC係数であるということのみである(YUV4:2:0およびYUV4:2:2カラーフォーマットイメージのクロミナンスチャネルでは、それより少ない)。キャッシュする必要があるものは、(YUV4:4:4の場合)マクロブロック当たり高々21個の係数である。さらに、左からの予測に用いる係数を、次のマクロブロックを符号化/復号化した後に廃棄することができる。従ってYUV4:4:4に対して、マクロブロックの次行で使用するためにはマクロブロック当り12個の係数をキャッシュすればよい。
タイリングをエンコーダ/デコーダが用いるとき、夫々のタイルは予測変換係数符号化の目的のため独立したイメージと見なされる。これにより、イメージタイルの独立した復号化が保証される。
3.コンピューティング環境
上述のエンコーダ200(図2)およびデコーダ300(図3)および予測変換係数符号化技術を、デジタルメディア信号処理を実施する任意の様々な装置上で実施することができる。この装置には、とりわけ、コンピュータ、イメージおよびビデオ録画および送受信装置、ポータブルビデオプレイヤー、ビデオ会議、等が含まれる。図15に示すように、デジタルメディア符号化技術をハードウェア回路、およびコンピュータまたは他のコンピューティング環境内部で実行するデジタルメディア処理ソフトウェアで実装することができる。
図15は、説明した実施形態を実装可能な、適切なコンピューティング環境(1300)の一般的な例を示す。本発明を多様な汎用目的または特殊目的のコンピューティング環境で実装できるので、コンピューティング環境(1300)は本発明の使用または機能性の範囲に対する制限を示唆するようには意図していない。
図15を参照する。コンピューティング環境(1300)には、少なくとも1つの演算装置(1510)とメモリ(1520)とが含まれる。図15では、この最も基本的な構成(1530)を点線内に含めてある。演算装置(1510)はコンピュータ実行可能命令を実行し、実際のプロセッサまたは仮想のプロセッサであることができる。マルチプロセッサシステムでは複数の演算装置がコンピュータ実行可能命令を実行して処理能力を高める。メモリ(1520)は揮発性メモリ(例えば、レジスタ、キャッシュ、RAM、等)、不揮発性メモリ(例えば、ROM、EEPROM、フラッシュメモリ、等)、または前述の2つの何らかの組合せであることができる。メモリ(1520)は説明した予測変換係数符号化技術を実装するソフトウェア(1580)を格納する。
コンピューティング環境は更なる特徴を有することができる。例えばコンピューティング環境(1500)には記憶装置(1540)、1つまたは複数の入力装置(1550)、1つまたは複数の出力装置(1560)、および1つまたは複数の通信接続(1570)が含まれる。バス、コントローラ、またはネットワークなどの相互接続メカニズム(示さず)は、コンピューティング環境(1500)の構成要素を相互接続する。一般に、オペレーティングシステムソフトウェア(示さず)は、コンピューティング環境(1500)内で実行される他のソフトウェアの動作環境を与え、コンピューティング環境(1500)のコンポーネントの活動を調整する。
記憶装置(1540)は取り外し可能または取り外し不能であることができ、磁気ディスク、磁気テープまたはカセット、CD−ROM、CD−RW、DVD、または情報の記憶に使用可能で且つコンピューティング環境(1500)内部でアクセス可能な任意の他の媒体が含まれる。記憶装置(1540)は、説明したエンコーダ/デコーダおよび予測変換係数符号化技術を実装するソフトウェア(1580)に対する命令を記憶する。
1つまたは複数の入力装置(1550)はタッチ入力装置であることができる。タッチ入力装置には例えば、キーボード、マウス、ペン、またはトラックボール、音声入力装置、スキャン装置、またはコンピューティング環境(1500)への入力を与える別の装置がある。オーディオに対して、入力装置(1550)は、アナログまたはデジタル形式でオーディオ入力を受付けるサウンドカードまたは同様な装置であることができ、またはコンピューティング環境に対してオーディオサンプルを与えるCD−ROMリーダであることができる。1つまたは複数の出力装置(1560)は、ディスプレイ、プリンタ、スピーカ、CDライタ、またはコンピューティング環境(1500)からの出力を与える別の装置であることができる。
1つまたは複数の通信接続(1570)は、通信媒体上での別のコンピューティングエンティティに対する通信を可能とする。通信媒体は、コンピュータ実行可能命令、圧縮オーディオまたはビデオ情報、または他のデータなどの情報を変調データ信号で運搬する。変調データ信号は、1つまたは複数の特性集合を有するかまたは信号内の情報を符号化するように変化した信号である。限定ではなく例として、通信媒体には、電気、光学、RF、赤外線、音響、または他のキャリアで実装した有線または無線技術が含まれる。
本明細書のデジタルメディア処理技術を、コンピュータ読取可能媒体の一般的コンテクストで説明することができる。コンピュータ読取可能媒体は、コンピューティング環境内部でアクセス可能な任意の有効な媒体である。限定ではなく例として、コンピューティング環境(1500)では、コンピュータ読取可能媒体にはメモリ(1520)、記憶装置(1540)、通信媒体、および上記の任意の組合せが含まれる。
本明細書のデジタルメディア処理技術を、プログラムモジュール内に含まれるもののような、ターゲットの実際のプロセッサまたは仮想のプロセッサのコンピューティング環境で実行されるコンピュータ実行可能命令の一般的コンテクストで説明することができる。一般に、プログラムモジュールには、特定のタスクを実施するかまたは特定の抽象データ型を実装するルーチン、プログラム、ライブラリ、オブジェクト、クラス、コンポーネント、データ構造、等が含まれる。様々な実施形態で望ましいように、プログラムモジュールの機能性を組み合わせるか、またはプログラムモジュール間で分割することができる。プログラムモジュールに対するコンピュータ実行可能命令を、ローカルまたは分散コンピューティング環境内部で実行することができる。
表示の都合上、詳細な説明では“決定する”、“生成する”、および“適用する”といった用語を使用して、コンピューティング環境におけるコンピュータ動作を説明した。これらの用語はコンピュータが実施する動作の高レベルな抽象化であり、人間が実施する動作と混同すべきではない。これらの用語に対応する実際のコンピュータ動作は実装によって変化する。
本明細書で説明した主題の多数の可能な変形を考慮して、添付請求項およびその等価物の範囲内にある実施形態の全てを我々の発明として主張する。
先行技術における従来のブロック変換ベースコーデックのブロック図である。 予測変換係数符号化を組み込んだ代表的なエンコーダのフロー図である。 予測変換係数符号化を組み込んだ代表的なデコーダのフロー図である。 DCおよびDCAC係数を示す4×4の変換ブロック構造の図である。 YUV4:2:2カラーフォーマットに関して、図3のエンコーダの内部段階変換において生成した係数の422クロマローパスブロック構造の図である。 YUV4:2:0カラーフォーマットイメージに関して、図3のエンコーダの内部段階変換において生成した係数の420クロマローパスブロック構造の図である。 DCAC予測の一例を示す図である。 図7のDCAC予測の例において、予測方向を識別する図である。 マクロブロックのDC予測モードの決定に用いるマクロブロックを示す図である。 図3のエンコーダおよび図4のデコーダ内の予測変換係数符号化におけるDC予測モード決定の擬似コードリストを示す図である。 図3のエンコーダおよび図4のデコーダ内の予測変換係数符号化におけるローパスDCAC予測モード決定の擬似コードリストを示す図である。 図3のエンコーダおよび図4のデコーダ内の予測変換係数符号化におけるハイパスDCAC予測モード決定の擬似コードリストを示す図である。 マクロブロックの左ハイパスDCAC予測を示す図である。 マクロブロックの上ハイパスDCAC予測を示す図である。 図4の広域係数の適応符号化を実装するのに適したコンピューティング環境のブロック図である。

Claims (20)

  1. 変換係数の予測符号化を用いてデジタルメディアデータを符号化する方法であって、
    前記方法は、
    前記デジタルメディアデータのブロックに変換(250)を適用して、各ブロックに対して変換係数群(400、500、600)を生成するステップであって、各ブロックの前記変換係数群は前記の各ブロックに対するDC係数を備えるステップと、
    カレントブロックの位置における前記デジタルメディアデータの少なくとも2つの方向性のうちの1つが支配的かどうかを判定するステップ(1000)と、
    前記の少なくとも2つの方向性のうちの1つが前記カレントブロックのデジタルメディアの位置において支配的であると判定される場合、前記判定された支配的な方向性に従って、前記カレントブロックのDC係数の予測因子を選択するステップ(1000)と、
    前記カレントブロックのDC係数をその予測因子に対して符号化するステップ(280)と
    を含むことを特徴とする方法。
  2. 前記少なくとも2つの方向性のうちのいずれもが前記カレントブロックのデジタルメディアの位置において支配的であると判定されない場合、前記少なくとも2つの方向性の組合せに従って前記カレントブロックのDC係数の予測因子を選択するステップを含むことを特徴とする請求項1に記載の方法。
  3. 前記方向性には少なくとも水平方向と垂直方向が含まれることを特徴とする請求項1に記載の方法。
  4. 前記カレントブロックの位置における前記デジタルメディアデータの少なくとも2つの方向性のうちの1つが支配的かどうかを判定するステップは、
    前記の少なくとも2つの方向性に対する方向差分メトリックを、前記少なくとも2つの方向性における先行ブロックのDC係数の関数として計算するステップと、
    計算した前記方向差分に基づいて、前記少なくとも2つの方向性のうちの1つが支配的かどうかを判定するステップと
    をさらに含むことを特徴とする請求項1に記載の方法。
  5. 前記方向差分メトリックを計算するステップは、
    前記少なくとも2つの方向性に対する前記方向差分メトリックを、前記少なくとも2つの方向性における前記デジタルメディアデータの複数のチャネルから得た先行ブロックのDC係数の関数として計算するステップをさらに含むことを特徴とする請求項4に記載の方法。
  6. 前記複数のチャネルは輝度チャネルおよび少なくとも1つのクロミナンスチャネルを含むことを特徴とする請求項4に記載の方法。
  7. 前記変換は、前記デジタルメディアデータのマクロブロック内のブロックに適用される第1の外部段階変換からのDC係数のブロックに適用される第2の内部段階変換であることを特徴とする請求項1に記載の方法。
  8. 各ブロックの前記変換係数群は前記各ブロックに対する複数のDCAC係数を含み、
    前記方法はさらに
    前記少なくとも2つの方向性のうちの1つが前記カレントブロックのデジタルメディアデータの位置において支配的であると判定されるとき、前記判定された支配的な方向性に従って前記カレントブロックのDCAC係数の予測因子を選択するステップと、
    そうでなければ、前記カレントブロックのDCAC係数を予測因子無しで符号化するステップと
    を含むことを特徴とする請求項7に記載の方法。
  9. 前記少なくとも2つの方向性のうちの1つが支配的であると判定されるときに前記カレントブロックのDCAC係数の予測因子を選択する際、
    前記判定された支配的な方向性に従って選択された予測因子を含むブロックが前記カレントブロックと同じ量子化器を有するかどうかを判定するステップと、
    そうでなければ、前記カレントブロックのDCAC係数を予測因子無しで符号化するステップと
    をさらに含むことを特徴とする請求項8に記載の方法。
  10. 前記第1の外部段階変換はカレントマクロブロック内のブロックに対して変換係数群を生成し、前記カレントマクロブロック内の各ブロックの前記変換係数群は前記第1の外部段階変換からの複数のDCAC係数を含み、
    前記方法はさらに
    前記少なくとも2つの方向性に対する方向差分メトリックを、前記カレントマクロブロック内のブロックのDC係数に対する前記第2の内部段階変換から生成したDCAC係数の関数として計算するステップと、
    前記計算した方向差分メトリックに基づいて、前記カレントマクロブロックに対して前記デジタルメディアデータの少なくとも2つの方向性のうちの1つが支配的かどうかを判定するステップと、
    前記少なくとも2つの方向性のうちの1つが前記カレントマクロブロックに対して支配的であると判定されるとき、前記判定された支配的な方向性に従って前記カレントマクロブロックのブロックの前記第1の外部段階変換で得たDCAC係数の予測因子を一方向に選択するステップと、
    前記カレントマクロブロックの複数のブロックの前記第1の外部段階変換で得た複数のDCAC係数をそれらの予測因子に対して符号化するステップと
    を含むことを特徴とする請求項7に記載の方法。
  11. 方向差分メトリックをDCAC係数の関数として計算する前記ステップは、
    前記少なくとも2つの方向性に対する方向差分メトリックを、前記デジタルメディアデータの複数のチャネルからの前記カレントマクロブロックにおけるブロックのDC係数に対する前記第2の内部段階変換から生成したDCAC係数の関数として計算するステップを含むことを特徴とする請求項10に記載の方法。
  12. 前記複数のチャネルは輝度チャネル及び少なくとも1つのクロミナンスチャネルを含むことを特徴とする請求項11に記載の方法。
  13. 請求項1に記載の方法に従って符号化した圧縮ビットストリームを有する少なくとも1つのコンピュータ読み取り可能な記録媒体。
  14. デジタルメディアエンコーダ(200)および/またはデコーダ(300)であって、
    符号化および/または復号化されるデジタルメディアデータ(210)を格納するデータ記憶バッファと、
    プロセッサ(1510)と
    を含み、
    前記プロセッサ(1510)は、
    カレントマクロブロック内部のブロックに対して前記デジタルメディアデータの少なくとも2つの方向性の1つが支配的であるかどうかを、前記カレントマクロブロック内部のブロックに適用される外部段階変換から生成したDC係数のブロックに適用される内部段階変換から生成したDCAC係数に基づいて判定し(1200)、
    前記少なくとも2つの方向性の1つが前記カレントブロック内部のブロックに対して支配的であると判定されるとき、前記判定された支配的な方向性に従って前記カレントマクロブロック内部のブロックの前記外部段階変換から生成した複数の前記DCAC係数の予測因子(1300,1400)を選択し、
    前記カレントマクロブロック内部のブロックの前記外部段階変換から生成した複数のDCAC係数をそれらの予測因子に対して符号化(280)および/または復号化(320)する
    ようにプログラムされたことを特徴とするデジタルメディアエンコーダおよび/またはデコーダ。
  15. 前記プロセッサを
    前記カレントブロックの位置において前記デジタルメディアデータの少なくとも2つの方向性のうちの1つが支配的であるかどうかを先行隣接マクロブロックのDC係数に基づいて判定し、前記先行隣接マクロブロックのそれぞれのDC係数を、前記それぞれの先行隣接マクロブロック内部のブロックに適用される前記外部段階変換から生成したDC係数のブロックに適用される前記内部段階変換から生成し、
    前記少なくとも2つの方向性のうちの1つが前記カレントブロックの位置において支配的であると判定されるとき、前記判定された支配的な方向性に従って前記カレントマクロブロックのDC係数の予測因子を選択し、前記カレントブロックのDC係数は、前記カレントマクロブロック内部のブロックに適用される前記外部段階変換から生成したDC係数のブロックに適用される前記内部段階変換から生成され、
    前記カレントマクロブロックのDCAC係数をその予測因子に対して符号化および/または復号化する
    ようにさらにプログラムしたことを特徴とする請求項14に記載のデジタルメディアエンコーダおよび/またはデコーダ。
  16. 前記プロセッサを
    前記少なくとも2つの方向性のうちの1つが前記カレントブロックの位置において支配的であると判定されるとき、前記カレントマクロブロックの量子化器が前記判定された支配的な方向性に従う方向で隣接マクロブロックの量子化器と異なるときを除いて、前記判定された支配的な方向性に従って前記カレントマクロブロックのDCAC係数の予測因子を選択し、前記カレントマクロブロックのDCAC係数は、前記カレントマクロブロック内部のブロックに適用される前記外部段階変換から生成したDC係数のブロックに適用される前記内部段階変換から生成され、
    前記カレントマクロブロックの複数のDCAC係数をそれらの予測因子に対して符号化および/または復号化する
    ようにさらにプログラムしたことを特徴とする請求項15に記載のデジタルメディアエンコーダおよび/またはデコーダ。
  17. 前記少なくとも2つの方向性のうちの1つが前記カレントブロック内部のブロックに対して、および前記マクロブロックの位置に対して支配的であるかどうかを判定することは、前記デジタルメディアデータの複数のチャネルであって、輝度チャネルおよび少なくとも1つのクロミナンスチャネルを含む複数のチャネルにおける前記それぞれの係数に基づくことを特徴とする請求項16に記載のデジタルメディアエンコーダおよび/またはデコーダ。
  18. デジタルメディアデータの処理方法を実施するコンピュータ実行可能なデジタルメディア処理プログラムを有する少なくとも1つのコンピュータ読み取り可能な記録媒体であって、
    前記方法は
    カレントマクロブロック内部のブロックに対する前記デジタルメディアデータの少なくとも2つの方向性に対する方向差分メトリックを、前記カレントマクロブロック内部のブロックに適用される外部段階変換から生成したDC係数のブロックに適用される内部段階変換から生成したDCAC係数に基づいて計算するステップ(1200)と、
    前記方向差分メトリックに基づいて、カレントマクロブロック内部のブロックに対する前記デジタルメディアデータの少なくとも2つの方向性のうちの1つが支配的かどうかを判定するステップ(1200)と、
    前記少なくとも2つの方向性のうちの1つが前記カレントブロック内部のブロックに対して支配的であると判定されるとき、前記判定された支配的な方向性に従って前記カレントマクロブロック内部のブロックの前記外部段階変換から生成したDCAC係数の予測因子を一方向に選択するステップ(1300,1400)と、
    前記カレントマクロブロック内部のブロックの前記外部段階変換から生成した複数のDCAC係数を、それらの予測因子に対して符号化(280)/復号化(320)するステップと
    を含むことを特徴とする少なくとも1つのコンピュータ読み取り可能な記録媒体。
  19. 前記のデジタルメディアデータ処理方法はさらに
    前記カレントマクロブロックの位置における前記デジタルメディアデータの少なくとも2つの方向性に対する方向差分メトリックを、先行隣接マクロブロックのDC係数に基づいて計算し、各マクロブロックのDC係数を前記各マクロブロック内部のブロックに適用される外部段階変換から生成したDC係数のブロックに適用される内部段階変換から生成するステップと、
    前記カレントマクロブロックの位置において前記デジタルメディアデータの少なくとも2つの方向性のうちの1つが支配的であるかどうかを、前記計算した方向差分メトリックに基づいて判定するステップと、
    前記少なくとも2つの方向性のうちの1つが前記カレントマクロブロックの位置において支配的であると判定される場合、前記判定された支配的な方向性に従って前記カレントマクロブロックのDC係数の予測因子を選択するステップと、
    前記カレントマクロブロックのDC係数をその予測因子に対して符号化/復号化するステップと
    を含むことを特徴とする請求項18に記載の少なくとも1つのコンピュータ読み取り可能な記録媒体。
  20. 前記のデジタルメディアデータ処理方法はさらに
    前記少なくとも2つの方向性のうちの1つが前記カレントブロックの位置において支配的であると判定されるとき、前記カレントマクロブロックの量子化器が前記判定された支配的な方向性に従う方向で隣接マクロブロックの量子化器と異なるときを除いて、前記判定された支配的な方向性に従って前記カレントマクロブロックのDCAC係数の予測因子を選択し、前記カレントマクロブロックのDCAC係数は、前記カレントマクロブロック内部のブロックに適用される前記外部段階変換から生成したDC係数のブロックに適用される前記内部段階変換から生成されるステップと、
    前記カレントマクロブロックの複数のDCAC係数をそれらの予測因子に対して符号化/復号化するステップと
    を含むことを特徴とする請求項19に記載の少なくとも1つのコンピュータ読み取り可能な記録媒体。
JP2008526092A 2005-08-12 2006-08-03 画像圧縮に関する変換係数の予測 Active JP5065272B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/203,009 US7933337B2 (en) 2005-08-12 2005-08-12 Prediction of transform coefficients for image compression
US11/203,009 2005-08-12
PCT/US2006/030563 WO2007021613A2 (en) 2005-08-12 2006-08-03 Prediction of transform coefficients for image compression

Publications (2)

Publication Number Publication Date
JP2009505496A true JP2009505496A (ja) 2009-02-05
JP5065272B2 JP5065272B2 (ja) 2012-10-31

Family

ID=37742497

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008526092A Active JP5065272B2 (ja) 2005-08-12 2006-08-03 画像圧縮に関する変換係数の予測

Country Status (16)

Country Link
US (1) US7933337B2 (ja)
EP (1) EP1922874B1 (ja)
JP (1) JP5065272B2 (ja)
KR (1) KR101247042B1 (ja)
CN (1) CN101243685B (ja)
AU (1) AU2006280178B2 (ja)
BR (1) BRPI0614766A2 (ja)
CA (1) CA2617632C (ja)
IL (1) IL189127A0 (ja)
MX (1) MX2008001852A (ja)
MY (1) MY145286A (ja)
NO (1) NO20080533L (ja)
NZ (1) NZ565593A (ja)
RU (1) RU2406255C2 (ja)
TW (1) TWI412265B (ja)
WO (1) WO2007021613A2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014520493A (ja) * 2011-06-30 2014-08-21 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 合成ビデオのためのロスレス・コード化および関連するシグナリング方法

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8532176B2 (en) * 2006-07-10 2013-09-10 Sharp Laboratories Of America, Inc. Methods and systems for combining layers in a multi-layer bitstream
FR2906433B1 (fr) * 2006-09-22 2009-02-27 Canon Kk Procedes et dispositifs de codage et de decodage d'images, programme d'ordinateur les mettant en oeuvre et support d'informaton permettant de les mettre en oeuvre
CA2665781C (en) 2006-10-30 2014-02-18 Nippon Telegraph And Telephone Corporation Predicted reference information generating method, video encoding and decoding methods, apparatuses therefor, programs therefor, and storage media which store the programs
JP4761566B2 (ja) * 2006-12-13 2011-08-31 キヤノン株式会社 画像処理装置及びその方法とプログラム及び媒体
US8571104B2 (en) * 2007-06-15 2013-10-29 Qualcomm, Incorporated Adaptive coefficient scanning in video coding
US8488668B2 (en) 2007-06-15 2013-07-16 Qualcomm Incorporated Adaptive coefficient scanning for video coding
US8819095B2 (en) 2007-08-28 2014-08-26 Qualcomm Incorporated Fast computation of products by dyadic fractions with sign-symmetric rounding errors
TWI370690B (en) * 2008-03-21 2012-08-11 Novatek Microelectronics Corp Method and apparatus for generating coded block pattern for highpass coeffecients
TWI349487B (en) * 2008-03-25 2011-09-21 Novatek Microelectronics Corp Entropy encoding circuit and encoding method thereof
JP5061330B2 (ja) * 2008-05-12 2012-10-31 株式会社メガチップス 画像処理装置
US8369638B2 (en) * 2008-05-27 2013-02-05 Microsoft Corporation Reducing DC leakage in HD photo transform
US8447591B2 (en) * 2008-05-30 2013-05-21 Microsoft Corporation Factorization of overlapping tranforms into two block transforms
KR101361005B1 (ko) 2008-06-24 2014-02-13 에스케이 텔레콤주식회사 인트라 예측 방법 및 장치와 그를 이용한 영상부호화/복호화 방법 및 장치
JP5015088B2 (ja) 2008-08-06 2012-08-29 株式会社リコー 画像処理装置、画像処理方法、コンピュータプログラム、及び、情報記録媒体
WO2010041857A2 (en) 2008-10-06 2010-04-15 Lg Electronics Inc. A method and an apparatus for decoding a video signal
US8275209B2 (en) 2008-10-10 2012-09-25 Microsoft Corporation Reduced DC gain mismatch and DC leakage in overlap transform processing
US9113168B2 (en) * 2009-05-12 2015-08-18 Lg Electronics Inc. Method and apparatus of processing a video signal
CN102474270A (zh) * 2009-08-06 2012-05-23 松下电器产业株式会社 编码方法、解码方法、编码装置及解码装置
TW201136319A (en) * 2009-08-06 2011-10-16 Panasonic Corp Encoding method, decoding method, encoding device and decoding device
WO2011016251A1 (ja) * 2009-08-06 2011-02-10 パナソニック株式会社 符号化方法、復号方法、符号化装置及び復号装置
KR20110015356A (ko) * 2009-08-07 2011-02-15 한국전자통신연구원 차분 신호의 특성에 기반한 적응적인 변환 부호화/양자화 영역을 이용한 동영상 부호화/복호화 장치 및 그 방법
US20110090952A1 (en) * 2009-10-21 2011-04-21 Cohen Robert A Directional Transforms for Video and Image Coding
EP2526696A4 (en) * 2010-01-22 2014-06-04 Thomson Licensing METHOD AND DEVICE FOR ENCODING IMAGE BLOCK OF IMAGE AND METHOD AND DECODING DEVICE THEREOF
CN102763417B (zh) * 2010-01-25 2015-12-02 汤姆森特许公司 单独地针对每个色彩平面的视频编码器、视频解码器、视频编码方法和视频解码方法
US8848779B2 (en) * 2010-07-15 2014-09-30 Sharp Laboratories Of America, Inc. Method of parallel video coding based on block size
CN102447895B (zh) 2010-09-30 2013-10-02 华为技术有限公司 扫描方法及装置、反扫描方法及装置
US9106913B2 (en) * 2011-03-08 2015-08-11 Qualcomm Incorporated Coding of transform coefficients for video coding
US20120230418A1 (en) 2011-03-08 2012-09-13 Qualcomm Incorporated Coding of transform coefficients for video coding
CA2842489C (en) * 2011-07-21 2016-09-27 Blackberry Limited Adaptive filtering based on pattern information
GB2501535A (en) * 2012-04-26 2013-10-30 Sony Corp Chrominance Processing in High Efficiency Video Codecs
AU2012232992A1 (en) 2012-09-28 2014-04-17 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding the transform units of a coding unit
US9602841B2 (en) * 2012-10-30 2017-03-21 Texas Instruments Incorporated System and method for decoding scalable video coding
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
WO2018041379A1 (en) * 2016-08-29 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Improvements for greatest common line index (gcli) video coding
WO2018041843A1 (en) * 2016-08-29 2018-03-08 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Encoder for Encoding, and Decoder for Decoding, a Digital Image Representation into a Data Stream using Indicating a Number of Leading Zero Bit Planes
US9996949B2 (en) * 2016-10-21 2018-06-12 Disney Enterprises, Inc. System and method of presenting views of a virtual space
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0360293A (ja) * 1989-07-28 1991-03-15 Victor Co Of Japan Ltd 映像信号圧縮方法および装置ならびに映像信号伸長方法および装置
JP2000023193A (ja) * 1998-06-26 2000-01-21 Sony Corp 画像符号化方法及び装置、画像復号方法及び装置、並びに提供媒体
JP2004056249A (ja) * 2002-07-17 2004-02-19 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP2005039743A (ja) * 2003-07-18 2005-02-10 Sony Corp 画像情報符号化装置及び方法、並びに画像情報復号装置及び方法

Family Cites Families (152)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4420771A (en) 1981-02-09 1983-12-13 Bell Telephone Laboratories, Incorporated Technique for encoding multi-level signals
ATE108587T1 (de) 1986-09-13 1994-07-15 Philips Nv Verfahren und schaltungsanordung zur bitratenreduktion.
US4730348A (en) 1986-09-19 1988-03-08 Adaptive Computer Technologies Adaptive data compression system
US4698672A (en) 1986-10-27 1987-10-06 Compression Labs, Inc. Coding system for reducing redundancy
US4968135A (en) 1987-08-17 1990-11-06 Digital Equipment Corporation System for producing pixel image data from CCITT encoded pixel data
US4792981A (en) 1987-09-21 1988-12-20 Am International, Inc. Manipulation of run-length encoded images
US4813056A (en) 1987-12-08 1989-03-14 General Electric Company Modified statistical coding of digital signals
EP0339589A3 (en) 1988-04-28 1992-01-02 Sharp Kabushiki Kaisha Orthogonal transform coding system for image data
US5043919A (en) 1988-12-19 1991-08-27 International Business Machines Corporation Method of and system for updating a display unit
DE3943880B4 (de) 1989-04-17 2008-07-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Digitales Codierverfahren
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
US5179442A (en) 1989-06-02 1993-01-12 North American Philips Corporation Method and apparatus for digitally processing a high definition television augmentation signal
US5128758A (en) 1989-06-02 1992-07-07 North American Philips Corporation Method and apparatus for digitally processing a high definition television augmentation signal
US5270832A (en) 1990-03-14 1993-12-14 C-Cube Microsystems System for compression and decompression of video data using discrete cosine transform and coding techniques
US5146324A (en) 1990-07-31 1992-09-08 Ampex Corporation Data compression using a feedforward quantization estimator
JPH04199981A (ja) 1990-11-29 1992-07-21 Nec Corp 即時処理型1次元符号器
US5266941A (en) 1991-02-15 1993-11-30 Silicon Graphics, Inc. Apparatus and method for controlling storage of display information in a computer system
JP2670201B2 (ja) 1991-08-30 1997-10-29 富士写真フイルム株式会社 画像データ圧縮符号化装置および方法
JP2586260B2 (ja) 1991-10-22 1997-02-26 三菱電機株式会社 適応的ブロッキング画像符号化装置
JP3134424B2 (ja) 1991-10-31 2001-02-13 ソニー株式会社 可変長符号化方法及び装置
US5227878A (en) 1991-11-15 1993-07-13 At&T Bell Laboratories Adaptive coding and decoding of frames and fields of video
DE69228983T2 (de) 1991-12-18 1999-10-28 Koninkl Philips Electronics Nv System zum Übertragen und/oder Speichern von Signalen von texturierten Bildern
EP0559348A3 (en) 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
CA2090052C (en) 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
US5227788A (en) 1992-03-02 1993-07-13 At&T Bell Laboratories Method and apparatus for two-component signal compression
US5714950A (en) 1992-07-23 1998-02-03 Samsung Electronics Co., Ltd. System for variable-length-coding and variable-length-decoding digitaldata
KR950010913B1 (ko) 1992-07-23 1995-09-25 삼성전자주식회사 가변장부호화 및 복호화시스템
JP3348310B2 (ja) 1992-09-28 2002-11-20 ソニー株式会社 動画像符号化方法および動画像符号化装置
CA2107727C (en) 1992-10-07 1999-06-01 Hiroaki Ueda Synchronous compression and reconstruction system
US5982437A (en) 1992-10-26 1999-11-09 Sony Corporation Coding method and system, and decoding method and system
JP2959916B2 (ja) 1992-10-28 1999-10-06 松下電器産業株式会社 デジタル・ビデオ・コーダ用のバーサタイルなエスケープ・ラン・レベル・コーダ
KR0166722B1 (ko) 1992-11-30 1999-03-20 윤종용 부호화 및 복호화방법 및 그 장치
US5467134A (en) 1992-12-22 1995-11-14 Microsoft Corporation Method and system for compressing video data
US5535305A (en) 1992-12-31 1996-07-09 Apple Computer, Inc. Sub-partitioned vector quantization of probability density functions
US5400075A (en) 1993-01-13 1995-03-21 Thomson Consumer Electronics, Inc. Adaptive variable length encoder/decoder
US5544286A (en) 1993-01-29 1996-08-06 Microsoft Corporation Digital video data compression technique
TW224553B (en) 1993-03-01 1994-06-01 Sony Co Ltd Method and apparatus for inverse discrete consine transform and coding/decoding of moving picture
US5376968A (en) 1993-03-11 1994-12-27 General Instrument Corporation Adaptive compression of digital video data using different modes such as PCM and DPCM
DE69424909T2 (de) 1993-04-09 2000-12-14 Sony Corp Verfahren und vorrichtung zur bildkodierung
US5408234A (en) 1993-04-30 1995-04-18 Apple Computer, Inc. Multi-codebook coding process
KR100458969B1 (ko) 1993-05-31 2005-04-06 소니 가부시끼 가이샤 신호부호화또는복호화장치,및신호부호화또는복호화방법
US5664057A (en) 1993-07-07 1997-09-02 Picturetel Corporation Fixed bit rate speech encoder/decoder
KR0155784B1 (ko) 1993-12-16 1998-12-15 김광호 영상데이타의 적응형 가변장 부호화/복호화방법
US5504591A (en) 1994-04-25 1996-04-02 Microsoft Corporation System and method for compressing graphic images
US5457495A (en) 1994-05-25 1995-10-10 At&T Ipm Corp. Adaptive video coder with dynamic bit allocation
US6141446A (en) 1994-09-21 2000-10-31 Ricoh Company, Ltd. Compression and decompression system with reversible wavelets and lossy reconstruction
US6195465B1 (en) 1994-09-21 2001-02-27 Ricoh Company, Ltd. Method and apparatus for compression using reversible wavelet transforms and an embedded codestream
US5568167A (en) 1994-09-23 1996-10-22 C-Cube Microsystems, Inc. System for providing antialiased video overlays
JP3474005B2 (ja) 1994-10-13 2003-12-08 沖電気工業株式会社 動画像符号化方法及び動画像復号方法
US5802213A (en) 1994-10-18 1998-09-01 Intel Corporation Encoding video signals using local quantization levels
AU697176B2 (en) 1994-11-04 1998-10-01 Koninklijke Philips Electronics N.V. Encoding and decoding of a wideband digital information signal
JP3371590B2 (ja) 1994-12-28 2003-01-27 ソニー株式会社 高能率符号化方法及び高能率復号化方法
US5574449A (en) 1995-02-24 1996-11-12 Intel Corporation Signal processing with hybrid variable-length and entropy encodidng
US5991451A (en) 1995-03-23 1999-11-23 Intel Corporation Variable-length encoding using code swapping
US5884269A (en) 1995-04-17 1999-03-16 Merging Technologies Lossless compression/decompression of digital audio data
US5864711A (en) 1995-07-05 1999-01-26 Microsoft Corporation System for determining more accurate translation between first and second translator, and providing translated data to second computer if first translator is more accurate
US5825830A (en) 1995-08-17 1998-10-20 Kopf; David A. Method and apparatus for the compression of audio, video or other data
US5796855A (en) 1995-10-05 1998-08-18 Microsoft Corporation Polygon block matching method
US5819215A (en) 1995-10-13 1998-10-06 Dobson; Kurt Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of digital audio or other sensory data
US5896176A (en) * 1995-10-27 1999-04-20 Texas Instruments Incorporated Content-based video compression
US5889891A (en) 1995-11-21 1999-03-30 Regents Of The University Of California Universal codebook vector quantization with constrained storage
JP3283413B2 (ja) 1995-11-30 2002-05-20 株式会社日立製作所 符号化復号方法、符号化装置および復号装置
JPH09162748A (ja) 1995-12-01 1997-06-20 Fujitsu Ltd データ符号化方法、データ復号方法、データ圧縮装置、データ復元装置、及びデータ圧縮・復元システム
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
US5831559A (en) 1996-01-24 1998-11-03 Intel Corporation Encoding/decoding video signals using multiple run-val mapping tables
US6957350B1 (en) 1996-01-30 2005-10-18 Dolby Laboratories Licensing Corporation Encrypted and watermarked temporal and resolution layering in advanced television
US5682152A (en) 1996-03-19 1997-10-28 Johnson-Grace Company Data compression using adaptive bit allocation and hybrid lossless entropy encoding
US5812971A (en) 1996-03-22 1998-09-22 Lucent Technologies Inc. Enhanced joint stereo coding method using temporal envelope shaping
US6215910B1 (en) 1996-03-28 2001-04-10 Microsoft Corporation Table-based compression with embedded coding
US5850482A (en) 1996-04-17 1998-12-15 Mcdonnell Douglas Corporation Error resilient method and apparatus for entropy coding
EP1835762A3 (en) * 1996-05-28 2007-10-03 Matsushita Electric Industrial Co., Ltd. decoding apparatus with intra prediction
DE19628292B4 (de) 1996-07-12 2007-08-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Verfahren zum Codieren und Decodieren von Stereoaudiospektralwerten
DE19628293C1 (de) 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
JP3318825B2 (ja) 1996-08-20 2002-08-26 ソニー株式会社 デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置
US5828426A (en) 1996-08-20 1998-10-27 Samsung Electronics Co., Ltd. Apparatus for decoding variable length coded data of both MPEG-1 and MPEG-2 standards
US6233017B1 (en) 1996-09-16 2001-05-15 Microsoft Corporation Multimedia compression system with adaptive block sizes
EP1691560B1 (en) 1996-09-20 2017-03-08 AT&T Corp. Video coder providing implicit coefficient prediction for image coding and intra coding of video
KR100346740B1 (ko) 1996-09-21 2002-09-18 삼성전자 주식회사 이산코사인변환계수예측방법
KR100346728B1 (ko) 1996-09-21 2002-10-12 삼성전자 주식회사 이산코사인변환의 dc 계수예측방법 및 이를 이용한 데이터 부호화방법
KR100303685B1 (ko) 1996-09-30 2001-09-24 송문섭 영상 예측부호화 장치 및 그 방법
US5748789A (en) 1996-10-31 1998-05-05 Microsoft Corporation Transparent block skipping in object-based video coding systems
SG102016A1 (en) 1996-11-06 2004-02-27 Matsushita Electric Ind Co Ltd Image coding and decoding methods
JP4049820B2 (ja) 1996-11-07 2008-02-20 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビットストリーム信号のデータ処理
EP0876709B1 (en) 1996-11-11 2003-08-06 Koninklijke Philips Electronics N.V. Data compression/expansion using a rice encoder/decoder
JP3484310B2 (ja) 1997-01-17 2004-01-06 松下電器産業株式会社 可変長符号器
NL1005084C2 (nl) 1997-01-24 1998-07-27 Oce Tech Bv Werkwijze voor het uitvoeren van een beeldbewerkingsoperatie op looplengte gecodeerde bitmaps.
US6038536A (en) 1997-01-31 2000-03-14 Texas Instruments Incorporated Data compression using bit change statistics
US6272175B1 (en) 1997-02-13 2001-08-07 Conexant Systems, Inc. Video signal coding systems and processes using adaptive quantization
US5974184A (en) 1997-03-07 1999-10-26 General Instrument Corporation Intra-macroblock DC and AC coefficient prediction for interlaced digital video
US6005980A (en) 1997-03-07 1999-12-21 General Instrument Corporation Motion estimation and compensation of video object planes for interlaced digital video
FI114248B (fi) 1997-03-14 2004-09-15 Nokia Corp Menetelmä ja laite audiokoodaukseen ja audiodekoodaukseen
US6728775B1 (en) 1997-03-17 2004-04-27 Microsoft Corporation Multiple multicasting of multimedia streams
US6404813B1 (en) 1997-03-27 2002-06-11 At&T Corp. Bidirectionally predicted pictures or video object planes for efficient and flexible video coding
US6259810B1 (en) 1997-04-15 2001-07-10 Microsoft Corporation Method and system of decoding compressed image data
US5883633A (en) 1997-04-15 1999-03-16 Microsoft Corporation Method and system of variable run length image encoding using sub-palette
US6580834B2 (en) 1997-05-30 2003-06-17 Competitive Technologies Of Pa, Inc. Method and apparatus for encoding and decoding signals
DE19730129C2 (de) 1997-07-14 2002-03-07 Fraunhofer Ges Forschung Verfahren zum Signalisieren einer Rauschsubstitution beim Codieren eines Audiosignals
US6421738B1 (en) 1997-07-15 2002-07-16 Microsoft Corporation Method and system for capturing and encoding full-screen video graphics
JP3884172B2 (ja) 1997-10-02 2007-02-21 株式会社東芝 可変長復号化装置および復号化方法
WO1999022525A1 (en) 1997-10-23 1999-05-06 Mitsubishi Denki Kabushiki Kaisha Image encoding method, image encoder, image decoding method, and image decoder
JPH11161782A (ja) 1997-11-27 1999-06-18 Seiko Epson Corp カラー画像の符号化方法およびその符号化装置ならびにカラー画像の復号化方法およびその復号化装置
US6111914A (en) 1997-12-01 2000-08-29 Conexant Systems, Inc. Adaptive entropy coding in adaptive quantization framework for video signal coding systems and processes
US5946043A (en) 1997-12-31 1999-08-31 Microsoft Corporation Video coding using adaptive coding of block parameters for coded/uncoded blocks
US6226407B1 (en) 1998-03-18 2001-05-01 Microsoft Corporation Method and apparatus for analyzing computer screens
US6054943A (en) 1998-03-25 2000-04-25 Lawrence; John Clifton Multilevel digital information compression based on lawrence algorithm
US6408029B1 (en) 1998-04-02 2002-06-18 Intel Corporation Method and apparatus for simplifying real-time data encoding
KR20010071519A (ko) 1998-06-19 2001-07-28 벤자민 에프 커틀러 제1 해상도를 가지는 인코딩된 이미지를 제2 해상도를가지는 이미지로 직접 디코딩하는 방법 및 장치
US6253165B1 (en) 1998-06-30 2001-06-26 Microsoft Corporation System and method for modeling probability distribution functions of transform coefficients of encoded signal
KR100281967B1 (ko) 1998-08-31 2001-02-15 전주범 공간 상관성을 이용한 영상 부호화 장치 및 그 방법
DE19840835C2 (de) 1998-09-07 2003-01-09 Fraunhofer Ges Forschung Vorrichtung und Verfahren zum Entropiecodieren von Informationswörtern und Vorrichtung und Verfahren zum Decodieren von Entropie-codierten Informationswörtern
JP3723740B2 (ja) 1998-10-06 2005-12-07 松下電器産業株式会社 ロスレス圧縮符号方法とその装置およびロスレス圧縮復号方法とその装置
US6377930B1 (en) 1998-12-14 2002-04-23 Microsoft Corporation Variable to variable length entropy encoding
US6300888B1 (en) 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6223162B1 (en) 1998-12-14 2001-04-24 Microsoft Corporation Multi-level run length coding for frequency-domain audio coding
US6404931B1 (en) 1998-12-14 2002-06-11 Microsoft Corporation Code book construction for variable to variable length entropy encoding
US6100825A (en) 1998-12-31 2000-08-08 Microsoft Corporation Cluster-based data compression system and method
US6477280B1 (en) 1999-03-26 2002-11-05 Microsoft Corporation Lossless adaptive encoding of finite alphabet data
US6678419B1 (en) 1999-03-26 2004-01-13 Microsoft Corporation Reordering wavelet coefficients for improved encoding
US6573915B1 (en) 1999-12-08 2003-06-03 International Business Machines Corporation Efficient capture of computer screens
US6567781B1 (en) 1999-12-30 2003-05-20 Quikcat.Com, Inc. Method and apparatus for compressing audio data using a dynamical system having a multi-state dynamical rule set and associated transform basis function
EP1294197A4 (en) 2000-05-23 2004-11-24 Matsushita Electric Ind Co Ltd METHOD AND DEVICE FOR CODING WITH VARIABLE LENGTH
US6542863B1 (en) 2000-06-14 2003-04-01 Intervideo, Inc. Fast codebook search method for MPEG audio encoding
US6683980B1 (en) 2000-07-28 2004-01-27 Microsoft Corporation System and method for compressing data
US6925249B1 (en) 2000-07-28 2005-08-02 Microsoft Corporation System and method for storing compressed data onto a storage medium
US6961685B2 (en) 2000-09-19 2005-11-01 Sy Bon K Probability model selection using information-theoretic optimization criterion
US6735339B1 (en) 2000-10-27 2004-05-11 Dolby Laboratories Licensing Corporation Multi-stage encoding of signal components that are classified according to component value
US6650784B2 (en) 2001-07-02 2003-11-18 Qualcomm, Incorporated Lossless intraframe encoding using Golomb-Rice
US6587057B2 (en) 2001-07-25 2003-07-01 Quicksilver Technology, Inc. High performance memory efficient variable-length coding decoder
US20030033143A1 (en) 2001-08-13 2003-02-13 Hagai Aronowitz Decreasing noise sensitivity in speech processing under adverse conditions
US6825847B1 (en) 2001-11-30 2004-11-30 Nvidia Corporation System and method for real-time compression of pixel colors
US7165028B2 (en) 2001-12-12 2007-01-16 Texas Instruments Incorporated Method of speech recognition resistant to convolutive distortion and additive distortion
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
CN101448162B (zh) 2001-12-17 2013-01-02 微软公司 处理视频图像的方法
JP4447197B2 (ja) * 2002-01-07 2010-04-07 三菱電機株式会社 動画像符号化装置および動画像復号装置
US7139703B2 (en) 2002-04-05 2006-11-21 Microsoft Corporation Method of iterative noise estimation in a recursive framework
US6653955B1 (en) 2002-05-09 2003-11-25 Lsi Logic Corporation Multi-symbol variable length code decoder
GB2388502A (en) 2002-05-10 2003-11-12 Chris Dunn Compression of frequency domain audio signals
US7016547B1 (en) 2002-06-28 2006-03-21 Microsoft Corporation Adaptive entropy encoding/decoding for screen capture content
DE10236694A1 (de) 2002-08-09 2004-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum skalierbaren Codieren und Vorrichtung und Verfahren zum skalierbaren Decodieren
US7328150B2 (en) 2002-09-04 2008-02-05 Microsoft Corporation Innovations in pure lossless audio compression
EP1734511B1 (en) 2002-09-04 2009-11-18 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7433824B2 (en) 2002-09-04 2008-10-07 Microsoft Corporation Entropy coding by adapting coding between level and run-length/level modes
US7424434B2 (en) 2002-09-04 2008-09-09 Microsoft Corporation Unified lossy and lossless audio compression
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US6795584B2 (en) 2002-10-03 2004-09-21 Nokia Corporation Context-based adaptive variable length coding for adaptive block transforms
WO2004038921A2 (en) 2002-10-23 2004-05-06 Divxnetworks, Inc. Method and system for supercompression of compressed digital video
US6646578B1 (en) 2002-11-22 2003-11-11 Ub Video Inc. Context adaptive variable length decoding system and method
US7324927B2 (en) 2003-07-03 2008-01-29 Robert Bosch Gmbh Fast feature selection method and system for maximum entropy modeling
US7724827B2 (en) 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
US8311119B2 (en) * 2004-12-31 2012-11-13 Microsoft Corporation Adaptive coefficient scan order
US7565018B2 (en) 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0360293A (ja) * 1989-07-28 1991-03-15 Victor Co Of Japan Ltd 映像信号圧縮方法および装置ならびに映像信号伸長方法および装置
JP2000023193A (ja) * 1998-06-26 2000-01-21 Sony Corp 画像符号化方法及び装置、画像復号方法及び装置、並びに提供媒体
JP2004056249A (ja) * 2002-07-17 2004-02-19 Sony Corp 符号化装置および方法、復号装置および方法、記録媒体、並びにプログラム
JP2005039743A (ja) * 2003-07-18 2005-02-10 Sony Corp 画像情報符号化装置及び方法、並びに画像情報復号装置及び方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014520493A (ja) * 2011-06-30 2014-08-21 ホアウェイ・テクノロジーズ・カンパニー・リミテッド 合成ビデオのためのロスレス・コード化および関連するシグナリング方法

Also Published As

Publication number Publication date
US7933337B2 (en) 2011-04-26
RU2008105032A (ru) 2009-08-20
NZ565593A (en) 2010-04-30
KR20080042816A (ko) 2008-05-15
BRPI0614766A2 (pt) 2011-04-12
EP1922874A2 (en) 2008-05-21
AU2006280178B2 (en) 2009-12-17
MX2008001852A (es) 2008-04-14
MY145286A (en) 2012-01-13
CN101243685A (zh) 2008-08-13
CA2617632C (en) 2014-04-22
WO2007021613A2 (en) 2007-02-22
CA2617632A1 (en) 2007-02-22
NO20080533L (no) 2008-05-09
RU2406255C2 (ru) 2010-12-10
KR101247042B1 (ko) 2013-03-25
IL189127A0 (en) 2008-08-07
WO2007021613A3 (en) 2007-12-06
EP1922874B1 (en) 2020-03-25
TWI412265B (zh) 2013-10-11
JP5065272B2 (ja) 2012-10-31
EP1922874A4 (en) 2011-08-31
TW200719694A (en) 2007-05-16
US20070036224A1 (en) 2007-02-15
CN101243685B (zh) 2015-06-17
AU2006280178A1 (en) 2007-02-22

Similar Documents

Publication Publication Date Title
JP5065272B2 (ja) 画像圧縮に関する変換係数の予測
JP6054920B2 (ja) 柔軟量子化
JP5457199B2 (ja) 変換ベースのデジタル・メディア・コーデックにおける計算の複雑性及び精度の制御
JP4102841B2 (ja) ビデオ画像を処理するコンピュータ実行方法
US8369638B2 (en) Reducing DC leakage in HD photo transform
JP4425563B2 (ja) フェーディング補償のためのパラメータ化
JP4545388B2 (ja) フェーディング推定/補償によりビデオフレームを処理するシステムおよび方法
BRPI0807189B1 (pt) Método, meio de armazenamento e sistema de processamento de mídia digital
RU2518932C2 (ru) Уменьшенное рассогласование коэффициентов усиления постоянной состовляющей (dc) и dc-утечки при обработке преобразования с перекрытием

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20090709

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090902

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20091015

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101028

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110126

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110202

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110223

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110302

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110328

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110404

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110422

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120619

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120711

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120809

R150 Certificate of patent or registration of utility model

Ref document number: 5065272

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150817

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313113

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250