JP2006523390A - オーバーコンプリート基底変換ベースの、動き残差フレーム符号化方法およびビデオ圧縮用装置 - Google Patents

オーバーコンプリート基底変換ベースの、動き残差フレーム符号化方法およびビデオ圧縮用装置 Download PDF

Info

Publication number
JP2006523390A
JP2006523390A JP2006504088A JP2006504088A JP2006523390A JP 2006523390 A JP2006523390 A JP 2006523390A JP 2006504088 A JP2006504088 A JP 2006504088A JP 2006504088 A JP2006504088 A JP 2006504088A JP 2006523390 A JP2006523390 A JP 2006523390A
Authority
JP
Japan
Prior art keywords
atom
residual image
energy
residual
basis
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2006504088A
Other languages
English (en)
Other versions
JP4804342B2 (ja
Inventor
ジョン、イー
ソーワー、マーク
ワン、メン
コート、ピーター
Original Assignee
デジタル アクセレレーター コーポレーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by デジタル アクセレレーター コーポレーション filed Critical デジタル アクセレレーター コーポレーション
Publication of JP2006523390A publication Critical patent/JP2006523390A/ja
Application granted granted Critical
Publication of JP4804342B2 publication Critical patent/JP4804342B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/001Model-based coding, e.g. wire frame
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/97Matching pursuit coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Color Television Systems (AREA)

Abstract

【解決手段】 本発明は、修正マッチング追跡アルゴリズムを使ったオーバーコンプリート基底変換に基づき、デジタル動画/ビデオ信号を圧縮する方法を提供する。より具体的には、本発明は、動き予測および動き補償の工程により生成される動き残差画像の効率的な符号化を重視したものである。前記残差画像における高エネルギー領域の形状および位置の初期推定を取得するには、残差エネルギー分割アルゴリズム(Residual Energy Segmentation Algorithm、略称RESA)が使用できる。マッチング追跡工程でマッチする評価数を低減するには、漸進的排除アルゴリズム(Progressive Elimination Algorithm、略称PEA)が使用できる。RESAおよびPEAは、事前に指定されたオーバーコンプリートな基底辞書からマッチする基底を検索する際、符号器を数倍高速化することが可能である。マッチしたパターンの3つのパラメータは、辞書のインデクスと、選択された基底の位置と、選択された基底パターンおよび残差信号の内積とを定義するアトムを形成する。本発明は、四分木技術に類似した技術を使った新しいアトム位置符号化方法と、新しいアトムモジュラス量子化スキームとを提供する。本発明に従ったシステムが低・中・高すべてのビットレート状況で適切に動作するようにするための量子化および位置符号化設計用に、簡易で効率的な適応機構が提供される。これらの新しいアルゴリズムコンポーネントは、より高速な符号化工程を実現し、これまでのマッチング追跡ベースのビデオ符号器を上回る圧縮性能をもたらす。

Description

本発明は圧縮の分野に関し、特にビデオ圧縮の方法およびその装置に関する。
一連の画像は膨大な格納スペースを要すことがあり、非圧縮デジタル形態で表現される際には、非常に高い転送帯域幅を必要とする。ポイントツーポイントデジタルビデオ通信は、数年前コンピュータネットワークおよび信号圧縮技術が進歩した結果、実用的なものになった。
デジタルビデオ圧縮を標準化する努力は1988年頃に開始された。現在では、動画専門家グループであるMoving Picture Experts Group(MPEG)委員会がISO/IECの下、MPEG−1およびMPEG−2の両規格を完成させており、MPEG−4規格も完成されているが、新しい提案もまだ受け付けられている。また、CCITTは、低ビットレートの応用を重視する一連の勧告、H.261、H.263、およびH.263+を開発した。これらの標準化の試みは、すべてビデオシーケンスを圧縮するため2つの工程からなる手順を利用している。第1の工程では、動き予測(motion estimation)および補償アルゴリズムを使用し、以前のビデオフレームを使って予測されるビデオフレームを現在のビデオフレーム用に作成する。この際、現在のビデオフレームと予測されるビデオフレームとの相違点が算出され、動き残差画像(motion residual picture、略称MRP)と呼ばれる。標準化されたこの手順の第2の工程では、離散コサイン変換(Discrete Cosine Transform、略称DCT)を使ってMRPを符号化する。このようなDCTベースのシステムは、すべての状況で適切に機能するとは限らない。個人ビデオ通信に必要な低ビットレートの場合、DCTベースのシステムでは顕著なゆがみと可視的なブロックアーティファクトとが起こる。DVDなど高品質のビジュアル用途では、達成される圧縮比が極めて低い。
動き残差画像は、他の変換ベースの技術を使って符号化することができる。例えば、離散ウェーブレット変換(discrete wavelet transforms、略称DWT)およびオーバーコンプリート基底変換などが使用できる。ZakhorおよびNeffは、米国特許第5,699,121号において、マッチング追跡と呼ばれるオーバーコンプリート基底変換アルゴリズムに基づく動き残差符号化システムを示した。これは、MallatおよびZhangにより、IEEE Transaction in Signal Processing、vol.41、No.12で、1993年12月に初めて提案されたものである。ZakhorおよびNeffのビデオ符号器では、標準的なDCTベースのビデオ符号器と比べ、ビジュアル品質とPNSRの双方が改善される。ただし、このシステムは、マッチした基底の位置符号化および変換係数の量子化にのみ対応できる一時的な設計であるため、非常に低速であり、圧縮性能が最適化されない。したがって、速度と効率の双方を提供できるオーバーコンプリート変換ベースの新しいビデオ符号化技術が必要とされている。
この背景事情は、本発明に関連性があると出願人が考える情報を知らしめる目的で提供するものであり、必ずしも了解を得ることを意図したものではない。また、以上の情報をもって本発明の先行技術と見なすと解釈すべきでもない。
本発明の目的は、オーバーコンプリート基底変換ベースの、動き残差フレーム符号化方法およびビデオ圧縮用装置を提供することである。本発明の態様によれば、オーバーコンプリートライブラリの基底関数を使って残差画像を符号化する方法は、サイズおよびエネルギーを有する前記残差画像を取得する工程と、前記残差画像を1若しくはそれ以上のアトムのリストへ分解する工程であって、各アトムが前記オーバーコンプリートライブラリの基底関数を表すものであり、前記残差画像を分解する工程は、(i)残差エネルギー分割アルゴリズムを使ったアトムによる表現用に、前記残差画像内で置換領域を識別する工程と、(ii)前記オーバーコンプリートライブラリから基底関数のサブセットを作成する工程であって、前記サブセット内の各基底関数は所定のしきい値内で前記置換領域にマッチする工程と、(iii)前記基底関数のサブセット内でアトムを識別する工程であって、前記アトムは前記置換領域の表現用でありパラメータを有する、前記識別する工程と、(iv)前記アトムを量子化し、前記アトムの前記パラメータを符号化に適した形態に修正する工程と、(v)前記量子化した前記アトムを符号化し、前記残差画像において前記置換領域から前記アトムを減算することにより、四分木ベースのアトム符号器を使って前記残差画像のエネルギーを低減して前記残差画像のサイズを縮小する工程と、(vi)前記縮小したサイズの前記残差画像または前記低減したエネルギーの前記残差画像を所定の基準と比較し、前記所定の基準が達成されるまで工程(i)〜(vi)を繰り返す工程とを含む、前記残差画像を分解する工程とを有し、これにより、前記残差画像を符号化し、前記残差画像のサイズを所定のレベルまで縮小する方法が提供される。
本発明の異なる別の態様によれば、オーバーコンプリートライブラリの基底関数を使って残差画像を符号化する装置であって、サイズおよびエネルギーを有する前記残差画像を取得する手段と、前記残差画像を1若しくはそれ以上のアトムのリストへ分解する工程であって、各アトムが前記オーバーコンプリートライブラリの基底関数を表すものであり、前記残差画像を分解する手段は、(i)残差エネルギー分割アルゴリズムを使ったアトムによる表現用に、前記残差画像内で置換領域を識別する手段と、(ii)前記オーバーコンプリートライブラリから基底関数のサブセットを作成する手段であって、前記サブセット内の各基底関数は所定のしきい値内で前記置換領域にマッチする手段と、(iii)前記基底関数のサブセット内でアトムを識別する手段であって、前記アトムは前記置換領域の表現用でありパラメータを有する、前記識別する手段と、(iv)前記アトムを量子化し、前記アトムの前記パラメータを符号化に適した形態に修正する手段と、(v)前記量子化した前記アトムを符号化し、前記残差画像において前記置換領域から前記アトムを減算することにより、四分木ベースのアトム符号器を使って前記残差画像のエネルギーを低減して前記残差画像のサイズを縮小する手段と、(vi)前記縮小したサイズの前記残差画像または前記低減したエネルギーの前記残差画像を所定の基準と比較する手段とを含む、前記残差画像を分解する手段とを有し、これにより、前記残差画像を符号化し、前記残差画像のサイズを所定のレベルまで縮小する装置が提供される。
本発明のさらに異なる別の態様によれば、コンピュータプログラム製品であって、オーバーコンプリートライブラリの基底関数を使って残差画像を符号化する方法を実行するためのコンピュータプログラムが記録された、コンピュータで読み込み可能な媒体を有するコンピュータプログラム製品であって、サイズおよびエネルギーを有する前記残差画像を取得する工程と、前記残差画像を1若しくはそれ以上のアトムのリストへ分解する工程であって、各アトムが前記オーバーコンプリートライブラリの基底関数を表すものであり、前記残差画像を分解する工程は、(i)残差エネルギー分割アルゴリズムを使ったアトムによる表現用に、前記残差画像内で置換領域を識別する工程と、(ii)前記オーバーコンプリートライブラリから基底関数のサブセットを作成する工程であって、前記サブセット内の各基底関数は所定のしきい値内で前記置換領域にマッチする工程と、(iii)前記基底関数のサブセット内でアトムを識別する工程であって、前記アトムは前記置換領域の表現用でありパラメータを有する、前記識別する工程と、(iv)前記アトムを量子化し、前記アトムの前記パラメータを符号化に適した形態に修正する工程と、(v)前記量子化した前記アトムを符号化し、前記残差画像において前記置換領域から前記アトムを減算することにより、四分木ベースのアトム符号器を使って前記残差画像のエネルギーを低減して前記残差画像のサイズを縮小する工程と、(vi)前記縮小したサイズの前記残差画像または前記低減したエネルギーの前記残差画像を所定の基準と比較し、前記所定の基準が達成されるまで工程(i)〜(vi)を繰り返す工程とを含む、前記残差画像を分解する工程とを有し、これにより、前記残差画像を符号化し、前記残差画像のサイズを所定のレベルまで縮小する方法が提供される。
本発明は、動き補償付きビデオ圧縮システムに使われる、オーバーコンプリート変換ベースの残差画像符号化用の新しい符号器である。本発明は、オーバーコンプリート辞書の基底関数を表すアトムのリストへと残差画像を分解することから、これまでのマッチング追跡ビデオ符号器に類似している。ただし、アトム検索工程は、残差エネルギー分割アルゴリズム(Residual Energy Segmentation Algorithm、略称RESA)および漸進的排除アルゴリズム(Progressive Elimination Algorithm、略称PEA)を使って実行される。前記基底辞書は、頻出する動き残差画像を特徴付けるため、非常に大きくなる場合がある。RESAでは、アトムを検索するため、より小さい基底のサブセットでの比較により辞書内で良好な該当結果が見つかるよう、動き残差画像において高エネルギーを伴う領域の大まかな形状および位置が識別される。さらに、PEAでは、検索ウィンドウのエネルギーを事前計算して考慮することによりパターン候補を漸次除去して、最適マッチの検索に必要な計算時間を短縮する。マッチしたアトムが見つかるたびに、そのアトムにより特徴付けられる部分が除去されて、その残差画像が更新される。アトムを検索し残差画像を更新する上記の工程は、望ましい圧縮ビットレートまたは品質が達成されるまで繰り返される。
本発明では、アトム検索手順を変える、オーバーコンプリート基底を伴ったマッチング追跡用の新しいモジュラス量子化スキームを導入する。変換から直接生成される係数は、ビットバジェット(ビット予算)下で最適デジタル符号化を行うための量子化を必要とする連続した浮動小数点値である。マッチング追跡アルゴリズムではインループ量子化器を使用する必要があり、その際、見つかったアトムはそれぞれ量子化されたのち、残差画像の更新に使われる。このため、各アトムは後続アトムの選択に影響を及ぼす。これまでのマッチング追跡方法のように符号化開始前に量子化器が指定されると、選択されたアトムモジュラスのリストの統計量に最適な量子化器の構成が依存するため、量子化スキームの最適化は困難である。本発明に従った量子化スキームでは、アトム検索工程中、量子化器を適宜選択する。
アトムモジュラスのほか、選択された基底のインデクスとアトムの位置とを、オーバーコンプリート変換ベースの符号器内で送信する必要がある。本発明は、アトム位置情報を効率的に符号化する方法を含む。アトム位置の分布により、1およびゼロのピクセル値が各位置におけるアトムの存在または不在をそれぞれ表す2Dマップが形成される。位置マップの符号化は、四分木技術に類似した技術で実現される。前記モジュラスおよび基底インデクスの情報は、位置符号化に埋め込まれる。カラービデオの異なるチャネル用のアトム(Y,U,V)は、独立して符号化される。
すべてのアトムパラメータは、残差画像の圧縮バージョンへと符号化されたのち送信される。復号化工程の場合、復号器は、符号化されたビットストリームを解釈してアトムパラメータに戻し、アトム情報を組み合わせて残差画像のストリームを再構成して、それを動き補償した画像と組み合わせてビデオストリームを再構成することにより、残差画像を再構成する。
本発明は、動き残差画像を符号化する方法であって、修正マッチング追跡アルゴリズムを使ってオーバーコンプリート基底空間において残差画像のアトム分解を行う工程と、モジュラス量子化器を選択する工程と、アトム位置マップと、モジュラスと、選択された基底用のインデクスを符号化する工程とを有する方法である。本発明は、上記の符号化方法を使って符号化された残差信号を復号化する方法をさらに提供する。
図1は、本発明の一実施形態に従った残差画像符号器20を使用したビデオ圧縮装置10により実行される、関連処理を例示したものである。まず、ビデオフレームは、現在のフレームを1つまたは2つの参照フレームと比較する動き予測器30により処理される。ほとんどの場合、ビデオ内の物体は、背景が同じまま後続フレームで位置を変える。参照フレームはビデオ復号器12に送信されるため、参照フレーム内の一部の領域は、現在のフレームの構成に使用できる。前記動き予測器30は、現在のフレーム内の領域に類似した領域を参照フレーム内で識別する。動き補償器32は、前記類似した領域間の差分を算出し、これらを動き残差画像として組み合わせる。類似した領域間の位置関係は動きベクトルとして表され、動きベクトルは動きベクトル符号器34により処理される。アトム分解器40がまず残差画像を処理し、その結果得られたアトムはアトム符号器42が圧縮する。符号化された動きベクトルおよびアトムは、マルチプレクサ22により組み合わせられて1つのビットストリームになる。圧縮されたビデオは、装置24により送信または格納され、そこから前記ビデオ復号器12へ圧縮形式のビデオ配信ができる。
図1の下部は復号器12を例示しており、この復号器12内部では、デマルチプレクサ26が圧縮ビデオ信号を分離し、対応するビットを動きベクトル復号器36および残差画像復号器28にそれぞれ送信する。動き再構成器38は、参照フレームおよび動きベクトルから予測フレームを形成する。前記残差画像復号器28は、残差画像を再構成する。これら2つの信号、すなわち予測フレームおよび残差フレームは、再構成された最終的ビデオフレームを生成するため互いに加算される。
図2は、Y色チャネル用の動き残差画像の例である。元の残差画像は、負および正の双方の値を有する。この残差画像を256レベルのグレー画像として適切に表示するため、この残差画像のピクセル値は、純粋なグレーがゼロを意味し、白および黒が負および正の値をそれぞれ表すようシフトおよびスケールされる。例えば、この残差画像には、ビデオ内の物体の動きに対応する複数の高エネルギー領域があるとする。
大半の信号圧縮技術は、いくつかの数学的変換により、元のデータをよりコンパクトな何らかの形式へと変換する。DCTおよびDWTなど一部の数学的変換では、可逆的な変換行列を形成する完全基底系を使用する。近年、オーバーコンプリート基底とそれに関連した変換アルゴリズムが著しい注目を浴びている。オーバーコンプリート基底辞書に含まれる基底の数は、元データの次元数をはるかに上回る。オーバーコンプリート基底の利点は、元の信号の真の特徴を表す上で、変換後の係数がより効果的であるという点にある。タイプの異なる信号用に基底辞書を構築するための数学的手法は多数存在する。ビデオの動き残差画像用の辞書はいくつか設計されており、残差画像の特徴をうまくカバーすることが実証されている。例えば、分離可能なガボール関数に基づく基底辞書は、NeffおよびZakhorにより"Very Low Bit Rate Video Coding Based on Matching Pursuits"(マッチング追跡に基づく非常に低ビットレートのビデオ符号化)、IEEE Transactions on Circuits and Systems for Video Technology、1997年2月、158〜171で説明されており、ハール関数に基づく基底辞書は、VleeschouwerおよびMacqにより"New dictionaries for matching pursuit video coding"(マッチング追跡ビデオ符号化のための新しい辞書)、Proc.of the 1998 International Conference on Image Processing、vol.1、764−768で説明されている。図3は、16の基底を含む辞書の単純な例である。上記の辞書のいずれも本発明に使用できる。特に上述のガボール辞書に関しては、400個の2D関数が明示的に言及されている。ただし、これら400の2D関数はそれぞれ画像内の考えうるすべての位置に配置できるため、実際にはより多数の基底構造が黙示的に含まれている。176×144ピクセルのフレームサイズを使う場合、辞書は実際には400×176×144=570万の基底構造を含むことが暗示され、これによりこの系は高度にオーバーコンプリートになる。S.MallatおよびZ.Zhangにより"Matching Pursuits With Time−Frequency Dictionaries"(時間−頻度辞書によるマッチング追跡)、IEEE Transaction in Signal Processing、vol.41、No.12、1993年12月で説明されている"マッチング追跡アルゴリズム"を直接使った変換では、変換係数の決定に極度に多くの計算を要する。ZakhorおよびNeffにより米国特許第5,699,121号で考案されたビデオ圧縮用のマッチング追跡は計算負荷を軽減するが、依然として計算上高価である。本発明は、一般辞書に基づき残差画像を変換する方法であって、前記アトム分解器40により実行される方法を提供し、また変換された係数を符号化する方法であって、前記アトム符号器42により実行される方法を提供する。
図4では、一実施形態に従った前記アトム分解器40の演算を完全に説明している。前記アトム分解器40により実行される第1の工程(ブロック61)は、初期検索領域の検索である。この工程は、その一実施形態を図5に示すとおり、残差エネルギー分割アルゴリズム(residual energy segmentation algorithm、略称RESA)により実現される。RESAは、一般的な領域成長の考えに基づいており、まず2×2のブロックを領域成長の開始点として選択する(ブロック70)。この工程は、図6に示すように16×16ブロックへの分割を要する。各ブロックにつき、全ピクセル強度の2乗の合計であるエネルギーが計算され、最高のエネルギーを伴うブロックは、例えば図6に示したブロック71として識別される。ブロック71はさらに4つの8×8サブブロックに分割され、最高のエネルギーを伴ったサブブロック72が識別される。その8×8サブブロック72内で最高のエネルギーを伴う2×2ブロック73も識別され、このブロックが領域成長の開始点として使われる。
RESAの次の工程(図5に例示したブロック74)は、現在の領域の左側にある2×2ブロックをチェックすることである。図7でこのRESA工程を例示する。しきい値は、次式で動的に計算される。
Figure 2006523390
ここで、AUは開始ブロックの左側に追加されたブロックの数、AEは現在の領域の2×2ブロックあたりの平均エネルギーを表す。チェックした2×2ブロックのエネルギーがしきい値より大きい場合、テストした2×2ブロックは現在の領域にグループ化され、現在の領域は新たにより大きく形成される。それ以外の場合は、この側に終了点が見出され、ブロックのグループ化は行われない。上記と対称的に同様な方法で、現在の領域の右側にある2×2ブロックがチェックされる。まず左側、次に右側への領域成長は、両側で終了点が見つかるか、矩形の幅が32に達するまで継続される(どちらかが先に起こるまで)。この工程後、水平方向に細長い矩形75が形成され、この細長い矩形の寸法は2*2m(1<=m<=16)となる。
RESAの最終工程(図5のブロック76)は、図8に示したように、細長い矩形75に基づき領域を垂直方向に成長させることである。この細長い矩形75の幅をWとし、現在の領域の上方に、次式のしきい値を伴う2*Wの細長い矩形を考える。
Figure 2006523390
ここで、Ausは初期の細長い矩形の上方に追加された2*W矩形の数、AEsは現在の領域に含まれる2*W矩形の1つあたりの平均エネルギーを表す。テストした2*W矩形がしきい値より大きいエネルギーを有する場合は、その矩形を現在の領域にマージする。それ以外の場合は、この側に終了点が見出される。上記と対称的に同様な方法で、現在の領域の下方にある2*W矩形がチェックされる。まず上方、次に下方への領域成長は、両側で終了点が見つかるか、現在の領域の高さが32に達するまで継続される(どちらかが先に起こるまで)。最終的には、2n*2m(1<=n,m<=16)の寸法を有する矩形77が得られる。
さらに図4を参照すると、この図ではマッチに最も近い基底を所与の辞書から検索する工程を例示している(ブロック62)。基底および残差画像のマッチングの度合いは、内積の絶対値(モジュラス)により表し、これをアトムモジュラスと呼ぶ。ここで、大きいモジュラスはマッチが良好であることを示す。このモジュラスを決定する工程では、多数の内積を計算し、最大のモジュラスを現在のアトムとして1つ選択する必要がある。この工程が、マッチング追跡アルゴリズムで最も遅い部分になりうる。古典的なマッチング追跡アルゴリズムでは、モジュラスを決定するため、辞書に含まれる数百万もの要素の各々と残差画像との内積を計算しなければならない。例えば先行技術では、残差画像内で最高のエネルギーを伴う16×16ブロックは、初期検索領域として単に選択され(各基底構造は選択されたブロック内の各位置を中心とし)、基底構造とそれに対応する残差領域との内積が計算される。400個の基底を伴う辞書の場合、この工程は256×400=102400の内積計算を必要とする。図9は、本発明に従った新しいマッチング追跡工程を例示している。
その結果得られるRESA矩形77(図8)から、高エネルギー特徴の形状に関する初期推定値が得られる。これを使い、そのRESA矩形とは異なりすぎる形状を有した辞書内の基底にフィルターをかける。次に、マッチする基底候補のサブセット(ブロック80)が形成される。矩形77の幅および高さをそれぞれwおよびhとし、それぞれ指定された幅および高さの形状を伴った全基底を含むサブ辞書が形成される。
Figure 2006523390
ここで、tw1とtw2とth1とth2とは、基底サイズを限定するため設定される値である。これらの値は、辞書構造に従って変更および調整できる。テストした基底のうち最大および最小のサイズのものを、矩形90および矩形91として図10に例示した。例えば、ブロックB80は単純なサブ辞書の例である。
RESAは、さらに残差画像内で高エネルギーを伴う特徴の位置を推定する。基底をマッチングするための位置候補は、前記RESA矩形77の中心付近で選択される(ブロック81)。図10は、小さい矩形92であって、その中心が矩形77の中心と同じである矩形92を示したものである。矩形92内のピクセルは、すべてテストする残差領域の中心として機能するものとする。図10の矩形94は、中心が点93、すなわち矩形92の左上隅になっている例である。矩形92の幅(ws)および高さ(hs)は、RESA矩形77に応じて可変であるとする。この関係は次式で表せる。
Figure 2006523390
矩形92のサイズは、実施時、他の規則により決定するか、単に固定される。良好なマッチはRESA矩形77の中心付近に位置するというのが、基本的な考え方である。さらに、すでにアトムの中心を含む矩形92内のいずれの位置も、新規アトム用に一切考慮されない。図10の点95がその例である。先行技術ではこのような制限を設けていないことに注意されたい。このタイプの制限の考え方は、1つのアトムが良好なフィットを提供する場合、このアトムは、過剰なエネルギーをその境界に導入することなく、前記アトムの中心付近のエネルギーを除去するはずというものである。従って、マッチング追跡アルゴリズムにとって、第2のアトムを生成する際同じ位置に戻ってしまうことは望ましくない。位置反復を許可しないというこの制限は符号化能力に何ら影響を与えなず、むしろアトム位置情報の符号化を単純化する。
次の処理工程(図9のブロック89)は、残差マッチング追跡用の漸進的排除アルゴリズム(progressive elimination algorithm、略称PEA)と呼ばれる。これは、テスト用基底サブ辞書およびテスト用位置セットの形成に使用される方法からは独立している。例えば、サブ辞書が辞書全体であり、かつ位置候補のセットが残差画像全体を有する座標のセットであっても、PEAは動作する。PEAは、比較候補を考慮の対象から漸次的に排除することにより、マッチする最も近い基底をより効率的に検索する方法である。これは、すべての基底候補を考えうるすべての位置で比較する古典的なマッチング追跡と対照的である。初期、最大モジュラスMmはゼロに設定される(ブロック82)。次に、基底b(k,l)が考慮される(ブロック83)。ここで、kおよびlは2D基底関数の幅および高さをそれぞれ表す。残差画像内の位置候補の1つr(k,l,p)に中心がある同じサイズの領域が形成される(ブロック84)。ブロック85では、r(k,l,p)のエネルギーである||r(k,l,p)||を現在の最大モジュラス(Mm)と比較し、r(k,l,p)とb(k,l)の内積を計算する必要があるか決定する。この演算を説明するには、次の数学的三角不等式を想起する必要がある。
Figure 2006523390
マッチング追跡の目的は、最大の|<r(k,l,p),b(k,l)>|を見つけることである。現在の最大モジュラスをMmとする。位置pでの基底b(k,l)に対し、対応する残差r(k,l,p)が||r(k,l,p)|| ||b(k,l)||<=Mmを満たすとすると、次式が成り立つ。
Figure 2006523390
この場合、内積<r(k,l,p),b(k,l)>の計算は不要となり、領域r(k,l,p)は次の位置に移動される。基底||b(k,l)||のノルムは推測的に計算でき(実際には大部分の基底が正規化される。すなわち||b(k,l)||=1)、このためこのテストの唯一の負荷は、エネルギーr(k,l,p)の計算だけになる。以下、||r(k,l,p)||を決定する効果的なアルゴリズムを説明する。
基底の高さ{v,v,…,v}にはn個の異なるサイズがあり、基底の幅{h,h,…,h}にはm個の異なるサイズがあるとする(値昇順)。検索矩形の寸法はhs*wsで、この検索矩形の左上の点はp(x,y)である。エネルギー値hs*ws*n*mは、以下の4工程で計算できる。
工程1:s=h+k列のエネルギーを計算する(図11にその列の例を示す)。これらの列の中心は(x−h/2+i,y)(i=0,1,…,s−1)にある。高さはvである。各エネルギーはC1,0(0),C1,1(0),…C1,s(0)と表され、計算は次式のようになる。
Figure 2006523390
ここで、e(x,y)は位置(x,y)におけるピクセルのエネルギーを表す。
上記の細長い矩形と同じ座標および長さvを有する次のs列のエネルギーは、次式で計算できる。
Figure 2006523390
一般には次式が成立する。
Figure 2006523390
工程2:工程1列から垂直にシフトした列のエネルギーを次式で計算する。
Figure 2006523390
ここで、aはyに対応する垂直シフト数を表す。
工程3:高さvj(j=1,…,n)、幅h,h,…,h、および中心(x,y+a)(v=0,1,…,hs)の領域のエネルギーを計算する。
Figure 2006523390
一般には、次のようになる。
Figure 2006523390
工程4:垂直ベース長さがv(j=1,…,n)、水平ベース長さがh(i=1,..,m)、および中心が(x+b,y+a)(b=1,…,wsおよびa=1,…,hs)の第1の領域セットのエネルギーを次式で計算する。
Figure 2006523390
最大モジュラスはマッチング追跡工程中、連続的に更新でき、これにより漸次的に検索空間を限定できる。複数の基底が同じサイズの場合もあり、その場合は複数の内積計算を1つのエネルギー計算で済ませることができる。PEAの能力は、良好なマッチ(最適マッチとは限らない)を見つける速度にも関係がある。大きな領域は常に大きなエネルギーを含むため、まず大寸法用の基底をテストする。
||r(k,l,p)||>Mmの場合はブロック86が実行され、r(k,l,p)およびb(k,l)の内積(p)が計算される。ブロック87では、pの絶対値と現在の最大モジュラスMmとが比較される。|p|>Mmであれば、新しいMmが|p|として設定され、対応する基底のインデクスおよび位置が記録される。そして、全検索位置のチェックが終わるまでブロック84に戻り続ける。次に、すべての基底候補がテストされるまでブロック83〜88が繰り返し実行される。最後に、次の3つのパラメータを含むアトムが生成される。1.辞書内の、最適マッチが得られる基底のインデクス。2.残差画像における最適マッチの(x,y)座標での位置。3.基底および残差画像の内積(p)。図12は、残差画像のアトムの例を示したものである。
さらに図4を参照すると、アトム検索後の工程は、アトムパラメータの記録である(ブロック63)。なお、この段階ではアトムのモジュラスの量子化は実行されない。決定ブロック64では、アトム量子化を開始するタイミングが決定される。この演算は、ビデオ圧縮システムにより定義されるレート制御の目標に依存する。圧縮比が固定されている場合は、別のアトム用にまだビット数が残っているかブロック64でチェックされる。実際の符号化はまだであるため、現在のアトムの符号化に使用されたビットを推定しなければならい。基底のインデクスおよび位置を符号化するための平均ビット数はBipと表し、i番目のアトムの量子化なしモジュラスの実際のビット数はBm(i)と表す。内積(p)の符号に1ビットが割り当てられたのち、n個のアトム用の使用済みビットが次式で推定される。
Figure 2006523390
ここで、Bipは最初の残差フレームから得られた体験データに従って初期化され、最終フレームの真の値として設定される。Bm(i)は、モジュラスごとに厳密に知ることができる。重要な事実は、モジュラスが後で量子化され、結果的にビット数が現在の推定値より少なくてすむということである。これにより、通常この段階では、アトム数は符号化できる数より少なくなる。実際の残差画像と比較した符号化残差画像の平均2乗誤差(MSE)により定義される特定品質を、ビデオシステムで達成することが望ましい場合は、ブロック64で、現在達成されているMSEがMSE目標値と比較される。アトムを1つ導入した後のMSEは、次式に従って更新される。
Figure 2006523390
ここで、MSE(n)はn個のアトムを使用した後のMSEを表し、p(n)はn番目のアトムの内積を表す。初期、MSEまたはMSE(0)が元の残差画像のエネルギーに設定される。MSE(n)は量子化実行後に増加する可能性が高いため、MSEの目的を達成しなくなる。要約すると、ビット数が利用可能であるか品質目標が未達成である場合は、現在のアトムに基づき残差画像が更新され(ブロック65)、次にまたブロック61から異なる別のアトムが検索される。また、ビット数または品質の目的が達成された場合は、量子化構成用のブロック66が実行される。標準的マッチング追跡アルゴリズムの1工程である残差画像の更新は、数学的には次式で記述される。
Figure 2006523390
現在のアトムでカバーされていない領域はまったく変更されない。
量子化器の設計(ブロック66)は、それまでの最小モジュラス(Minm)値に基づく。量子化のステップサイズ(QS)は次のように設定される。
Figure 2006523390
この時点までに見つかったすべてのアトムは、単純なミッドトレッド線形量子化スキームで上記のQSを使って量子化される。次に、量子化されたアトムモジュラスリスト67に従って残差画像が再び更新される。量子化前後のアトム係数はそれぞれp(i)およびq(i)であるとする(i=1,…,n)。また、対応する基底はb(i)とする(i=1,…,n)。n非量子化アトム後の残差画像は、次式で表せる。
Figure 2006523390
そのエネルギー||E(n)||も知られる。量子化後の残差エネルギー計算には2つの方法がある。第1の方法は、次のとおり、量子化後、単に残差画像を計算するというものである。
Figure 2006523390
もう一つの方法は、残差画像を再帰的に更新するというものである。p(i)の量子化誤差はΔp(i)とする。すると、p(n)だけが量子化された残差画像は、次式のようになる。
Figure 2006523390
p(n)およびp(n−1)が量子化された残差は、次のようになる。
Figure 2006523390
この関係は再帰的に真であり、次式で表せる。
Figure 2006523390
対応するエネルギーは次式で表せる。
Figure 2006523390
最後に、次のアトム検索の開始点となるEQ(n)および||EQ(n)||を取得する。重要なことは、再帰的更新用のアトムのリストがいかなる順序でもよいという点である。これは、この更新がアトムが見つかった順序で起こらないためである。
アトムのモジュラスは量子化されているため、レート制御または品質目標を達成するにはより多くのアトムが必要になる。したがって、追加アトムを検索するためブロック68が実行される。この工程はブロック61〜63と同じであるが、アトムモジュラスは、この段階でただちに量子化される。この時点で、モジュラスが(QS−QS/4)より小さいアトムを、その量子化値をゼロに設定して破棄することなく扱う必要がある。使用するスキームは次のとおりである。
1.アトムモジュラスが(QS−QS/4)より大きい場合、量子化器はQSを使用する。
2.それ以外の場合、アトムモジュラスが(QS/2−QS/8)より大きい場合、そのアトムモジュラスはQS/2として量子化される。
3.それ以外の場合、アトムモジュラスが(QS/4−QS/16)より大きい場合、そのアトムモジュラスはQS/4として量子化される。
4.それ以外の場合、アトムモジュラスが(QS/8−QS/32)より大きい場合、そのアトムモジュラスはQS/8として量子化される。
実際には、3レベルが通常十分であるが、それ以上のレベル使われることもある。
ブロック68の後、真のレート制御ロジックユニットが実行される(ブロック69)。この段階においてアトムはインループで量子化されるため、もたらされる品質または実際に使用されるビット数が推定可能になる。圧縮目標が達成された場合、システムはアトム符号器42へ進む。それ以外の場合は量子化したアトムモジュラスに基づき残差画像が更新され、システムは次のアトムを探すためブロック68へ戻る。カラービデオの場合、残差画像は複数のチャネル、すなわちYチャネル、Uチャネル、およびVチャネルを含む。アトム分解器40は、各チャネル用に独立して使われる。このスキームにより、各チャネルは独自のビットバジェットまたは望ましい品質目標を有することができる。ある種のビット割り当て方法は、異なるチャネル用にビットバジェットを割り当てるため使用できる。
すべてのアトムは、圧縮形態での出力用にアトム符号器42へ渡される。本発明では、図13に例示したように、2値マップとして各チャネルに関するアトム分布を考慮している。黒いピクセルは対応する位置にアトムがあることを表し、白いピクセルは対応する位置にアトムがないことを表す。四分木状の技術を使うとアトムを含む位置を符号化できるが、同じ演算を他の技術でも行えることは容易に理解できるであろう。各アトムの他のパラメータは、例えば可変長符号化を使ってアトム位置情報の後に符号化できるが、当業者に公知のように他の符号化技術も使用できる。アトムパラメータ信号用の符号化手順は図14に例示しており、以下でより詳しく説明する。
アトム符号化の第1の工程は、例えば図13に例示したように、アトムマップ全体をn*nブロックに分解することである(ブロック101)。値nは16(Yチャネル用)か8(UチャネルおよびVチャネル用)かである。各n*nブロックにつき、そのブロックにアトムがなければゼロビットが出力される。それ以外の場合は1ビットが出力され、そのブロックは前記復号器へのアトムを見つけるためさらに処理される。これには四分木分解手順が使われ、以下の4工程で要約が行われる。
工程1.1要素すなわちn*nブロック自体によりアトムブロックのリスト(list of atom blocks、略称LAB)を初期化する。
工程2.1要素eをLABから選択する。eのサイズが1*1の場合、その位置以外の全アトムパラメータを出力する。すなわち、基底インデクスと、モジュラスと、eの内積の符号とを出力したのち、工程4へ進む。それ以外の場合は、工程3へ進む。
工程3.eの4つのサブブロックのアトムパターンビットaを出力する。ここで、a(i=1,2,3,4)は、対応するサブブロックにアトムがある場合1になり、それ以外の場合はゼロになる。1に等しいa値を伴うすべてのサブブロックiを前記LABの末尾に配置し、工程2に戻る。
工程4.LABが空かチェックする。空でなければ工程2に戻り、それ以外の場合は、その1つのn*nブロックの符号化を終了する。
基底インデクスおよびアトムモジュラスは、ビット数を保存するため可変長符号器を使って符号化できる。これは、これらの信号パラメータが均一に分布しているとは限らないためである。アトム位置情報は、0/1ビットデータでの前記分解手順を記録することにより、黙示的に符号化できる。可変長符号化方法を使うと、前記4つのサブブロックのアトムパターンビットaを符号化できる。アトムパターンビットaのパターンには15種類ある。ここで、0000が不可能なことに注意する。ただし、1000など一部のパターンは、他のパターンよりはるかに高い確率で起こる。種々のパターンの確率は実験で推定可能になり、可変長テーブルを設計する上で使用できる。さらに、種々のチャネルおよび種々のアトム密度については、確率分布が可変になりうることに注意すべきである。したがって、複数のテーブルを使用して、ブロックのカテゴリ情報は、復号化のため使用すべきテーブルが復号器側にわかるよう最初に符号化することができる。
図15は、前記アトム符号器42が実行する演算の逆の演算を実行するアトム復号器46を例示したものである。まず、現在のn*nブロックのステータスを表す1ビットを前記アトム復号器46が受信する。その値が1であれば、対称的な四分木分解手順で処理が行われる。まず、このn*nブロックは4つのサブブロックに分割される。この4つのサブブロック用のアトムパターンビットは、逆可変長符号化(variable length coding、略称VLC)を使って復号化される。次に、値が1であるすべてのサブブロックが、アトムブロックのリスト(list of atom blocks、略称LAB)内に配置される。このLABに含まれる各要素を再帰的に分解し、そのアトムパターンビットを取得することにより、このLABは動的に更新される。このLABの要素が1*1ブロックである場合、アトム基底インデクスおよびモジュラスは、前記逆VLCテーブルを使って復号化する必要があり、内積の符号を表すビットを読み込む必要がある。1つのn*nブロック用のアトム復号器は、LABが空になると終了される。
次に、復号化されたアトムパラメータ信号は、古典的なマッチング追跡方法を使って1チャネルずつ残差画像を形成する残差再構成器48に渡される。初期、残差画像のすべてのピクセルはゼロに設定される。次に、以下の手順を使って各アトムが1つずつ加算される。i番目のアトム係数、およびそれに対応する2D基底行列を、q(i)およびb(i,k,l)それぞれ表すとする。(x(i),y(i))がi番目のアトムの位置を表すとし、現在の残差画像を新たに取得するため、位置(x(i),y(i))において現時点で構成済みの残差画像に行列q(i)*b(i,k,l)が加算される。この工程は、そのチャネルについてすべてのアトムが加算されるまで繰り返される。各チャネルが分解された時点でこの工程は終了され、残差画像が再構成される。
従来のマッチング追跡ベースのビデオ符号化に精通した者であれば、本発明に従った技術に付随した多数の優位性を理解できるであろう。オーバーコンプリート基底空間に基づく前記アトム分解工程は、より正確なエネルギー領域推定手順および漸進的候補排除アルゴリズムを介し、より高速化されてきた。先行技術では量子化器を変換開始前に指定するのに対し、アトムモジュラス量子化器の設計は、アトム分解スキームによりスムーズに選択される。最後に、本発明の四分木ベース分解スキームはアトム間の空間関係を有効活用するため、前記アトム符号化工程はより効率的である。特に、本発明と比較すると、先行技術ではすべてのアトムを1Dリストに集めるため、効率的な符号化をより困難にしている。
以上、本発明の実施形態を本明細書で説明したが、本発明には種々の変形形態が可能なことはいうまでもない。このような変形形態は本発明の要旨を変更するとは見なされず、当業者であれば、このようなすべての修正形態が以下の請求項の範囲を含まれるよう意図されていることが容易に理解される。
図1は、本発明の一実施形態に従った、オーバーコンプリート基底変換とそれに関連する符号化方法とを使用するビデオ圧縮システムを全体的に例示する図。 図2は、本発明の一実施形態により処理される動き残差画像の例を示した図。 図3は、本発明の一実施形態に使用するための、16個の基底を伴う簡易辞書を例示した図。 図4は、本発明の一実施形態に従った、オーバーコンプリート基底に基づいたアトム分解工程全体を説明した図。 図5は、本発明の一実施形態に従った、残差エネルギー分割アルゴリズム(residual energy segmentation algorithm、略称RESA)により実行される基本工程を説明した図。 図6は、本発明の一実施形態に従った、RESAの第1の工程を例示した図。 図7は、本発明の一実施形態に従った、RESAの第2の工程、すなわち水平成長スキームを例示した図。 図8は、本発明の一実施形態に従った、RESAの第3の工程、すなわち垂直成長スキームを例示した図。 図9は、本発明の一実施形態に従った、漸進的排除アルゴリズム(progressive elimination algorithm、略称PEA)を使ったマッチング追跡アトム検索を説明した図。 図10は、本発明の一実施形態に従った、マッチする基底のサブ辞書および検索位置候補の形成方法を例示した図。 図11は、本発明の一実施形態に従った、領域エネルギーの高速計算を例示した図。 図12は、本発明の一実施形態に従った、1つのアトム用のパラメータを例示した図。 図13は、本発明の一実施形態に従ったアトム位置マップの例を示した図。 図14は、本発明の一実施形態に従ったアトム符号化工程を例示したフローチャート。 図15は、本発明の一実施形態に従った、圧縮残差信号の復号化を例示したフローチャート。

Claims (11)

  1. オーバーコンプリートライブラリの基底関数を使って残差画像を符号化する方法であって、
    a)前記残差画像を取得する工程であって、サイズおよびエネルギーを有する前記残差画像を取得する工程と、
    b)前記残差画像を1若しくはそれ以上のアトムのリストへ分解する工程であって、各アトムが前記オーバーコンプリートライブラリの基底関数を表すものであり、前記残差画像を分解する工程は、
    i)残差エネルギー分割アルゴリズムを使ったアトムによる表現用に、前記残差画像内で置換領域を識別する工程と、
    ii)前記オーバーコンプリートライブラリから基底関数のサブセットを作成する工程であって、前記サブセット内の各基底関数は所定のしきい値内で前記置換領域にマッチする工程と、
    iii)前記基底関数のサブセット内でアトムを識別する工程であって、前記アトムは前記置換領域の表現用でありパラメータを有する、前記識別する工程と、
    iv)前記アトムを量子化し、前記アトムの前記パラメータを符号化に適した形態に修正する工程と、
    v)前記量子化した前記アトムを符号化し、前記残差画像において前記置換領域から前記アトムを減算することにより、四分木ベースのアトム符号器を使って前記残差画像のエネルギーを低減して前記残差画像のサイズを縮小する工程と、
    vi)前記縮小したサイズの前記残差画像または前記低減したエネルギーの前記残差画像を所定の基準と比較し、前記所定の基準が達成されるまで工程(i)〜(vi)を繰り返す工程と
    を含む、前記残差画像を分解する工程とを有し、
    これにより、前記残差画像を符号化し、前記残差画像のそのサイズを所定のレベルまで縮小する方法。
  2. 請求項1の方法において、前記基底関数のサブセット内でアトムを識別する工程は、漸進的排除アルゴリズムを使って実行されるものである。
  3. 請求項1の方法において、前記置換領域を識別する工程は、RESA矩形の生成を有するものである。
  4. 請求項3の方法において、前記置換領域を識別する工程は、前記残差画像内で最高のエネルギーを有する初期領域を識別する工程と、前記初期領域から前記RESA矩形を成長させる工程とを有するものである。
  5. 請求項1の方法において、前記基底関数のサブセット内でアトムを識別する工程は、基底関数と前記置換領域との内積を決定する工程を有し、前記内積の最大絶対値は最良のマッチを示すものである。
  6. 請求項3の方法において、前記RESA矩形は、前記オーバーコンプリートライブラリの前記基底関数と比較され、前記RESA矩形と十分マッチする基底関数は、前記基底関数のサブセット内に配置されるものである。
  7. 請求項2の方法において、前記漸進的排除アルゴリズムは、現在評価中の基底関数を前回評価された基底関数と比較することにより、基底関数を前記基底関数のサブセットから除去するものである。
  8. 請求項1の方法において、前記アトムを量子化する工程は、前記アトムと前記置換領域との比較に基づき、量子化器(quantizer)を決定する工程を有するものである。
  9. 請求項1の方法において、前記所定の基準は、望ましいビットストリームサイズに基づいて決定されるものである。
  10. オーバーコンプリートライブラリの基底関数を使って残差画像を符号化する装置であって、
    a)前記残差画像を取得する手段であって、サイズおよびエネルギーを有する前記残差画像を取得する手段と、
    b)前記残差画像を1若しくはそれ以上のアトムのリストへ分解する手段であって、各アトムが前記オーバーコンプリートライブラリの基底関数を表すものであり、前記残差画像を分解する手段は、
    i)残差エネルギー分割アルゴリズムを使ったアトムによる表現用に、前記残差画像内で置換領域を識別する手段と、
    ii)前記オーバーコンプリートライブラリから基底関数のサブセットを作成する手段であって、前記サブセット内の各基底関数は所定のしきい値内で前記置換領域にマッチする手段と、
    iii)前記基底関数のサブセット内でアトムを識別する手段であって、前記アトムは前記置換領域の表現用でありパラメータを有する、前記識別する手段と、
    iv)前記アトムを量子化し、前記アトムの前記パラメータを符号化に適した形態に修正する手段と、
    v)前記量子化した前記アトムを符号化し、前記残差画像において前記置換領域から前記アトムを減算することにより、四分木ベースのアトム符号器を使って前記残差画像のエネルギーを低減して前記残差画像のサイズを縮小する手段と、
    vi)前記縮小したサイズの前記残差画像または前記低減したエネルギーの前記残差画像を所定の基準と比較する手段と
    を含む、前記前記残差画像を分解する手段とを有し、
    これにより、前記残差画像を符号化し、前記残差画像のそのサイズを所定のレベルまで縮小する装置。
  11. オーバーコンプリートライブラリの基底関数を使って残差画像を符号化する方法を実行するためのコンピュータプログラムが記録された、コンピュータで読み込み可能な媒体を有するコンピュータプログラム製品であって、
    a)前記残差画像を取得する工程であって、サイズおよびエネルギーを有する前記残差画像を取得する工程と、
    b)前記残差画像を1若しくはそれ以上のアトムのリストへ分解する工程であって、各アトムが前記オーバーコンプリートライブラリの基底関数を表すものであり、前記残差画像を分解する工程は、
    i)残差エネルギー分割アルゴリズムを使ったアトムによる表現用に、前記残差画像内で置換領域を識別する工程と、
    ii)前記オーバーコンプリートライブラリから基底関数のサブセットを作成する工程であって、前記サブセット内の各基底関数は所定のしきい値内で前記置換領域にマッチする工程と、
    iii)前記基底関数のサブセット内でアトムを識別する工程であって、前記アトムは前記置換領域の表現用でありパラメータを有する、前記識別する工程と、
    iv)前記アトムを量子化し、前記アトムの前記パラメータを符号化に適した形態に修正する工程と、
    v)前記量子化した前記アトムを符号化し、前記残差画像において前記置換領域から前記アトムを減算することにより、四分木ベースのアトム符号器を使って前記残差画像のエネルギーを低減して前記残差画像のサイズを縮小する工程と、
    vi)前記縮小したサイズの前記残差画像または前記低減したエネルギーの前記残差画像を所定の基準と比較し、前記所定の基準が達成されるまで工程(i)〜(vi)を繰り返す工程と
    を含む、前記残差画像を分解する工程とを有し、
    これにより、前記残差画像を符号化し、前記残差画像のそのサイズを所定のレベルまで縮小するコンピュータプログラム製品。
JP2006504088A 2003-03-28 2004-03-29 オーバーコンプリート基底変換ベースの、動き残差フレーム符号化方法およびビデオ圧縮用装置 Expired - Lifetime JP4804342B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
CA2423618 2003-03-28
CA2,423,618 2003-03-28
PCT/CA2004/000464 WO2004086302A1 (en) 2003-03-28 2004-03-29 Overcomplete basis transform-based motion residual frame coding method and apparatus for video compression

Publications (2)

Publication Number Publication Date
JP2006523390A true JP2006523390A (ja) 2006-10-12
JP4804342B2 JP4804342B2 (ja) 2011-11-02

Family

ID=33034936

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006504088A Expired - Lifetime JP4804342B2 (ja) 2003-03-28 2004-03-29 オーバーコンプリート基底変換ベースの、動き残差フレーム符号化方法およびビデオ圧縮用装置

Country Status (12)

Country Link
US (1) US8204109B2 (ja)
EP (1) EP1629436B8 (ja)
JP (1) JP4804342B2 (ja)
CN (1) CN100399357C (ja)
AT (1) ATE336763T1 (ja)
AU (1) AU2004223358B2 (ja)
BR (1) BRPI0408835A (ja)
CA (1) CA2560075A1 (ja)
DE (1) DE602004001993T2 (ja)
RU (1) RU2335803C2 (ja)
WO (1) WO2004086302A1 (ja)
ZA (1) ZA200508764B (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013540403A (ja) * 2010-10-14 2013-10-31 トムソン ライセンシング 運動行列を用いた映像の符号化および復号のための方法および装置
US9071346B2 (en) 2013-11-11 2015-06-30 Fujitsu Limited Receiver and receiving method

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006106508A2 (en) * 2005-04-04 2006-10-12 Technion Research & Development Foundation Ltd. System and method for designing of dictionaries for sparse representation
US8121848B2 (en) * 2005-09-08 2012-02-21 Pan Pacific Plasma Llc Bases dictionary for low complexity matching pursuits data coding and decoding
KR20090073112A (ko) * 2006-09-22 2009-07-02 톰슨 라이센싱 다중 경로 비디오 코딩 및 디코딩을 위한 방법 및 장치
US20100040146A1 (en) * 2006-09-22 2010-02-18 Beibei Wang Method and apparatus for multiple pass video coding and decoding
US10194175B2 (en) 2007-02-23 2019-01-29 Xylon Llc Video coding with embedded motion
PL2559240T3 (pl) 2010-04-13 2020-01-31 Ge Video Compression, Llc Predykcja międzypłaszczyznowa
CN106060557B (zh) 2010-04-13 2019-10-11 Ge视频压缩有限责任公司 编解码器及方法、数组重建方法、数据存储介质及方法
KR102129404B1 (ko) 2010-04-13 2020-07-02 지이 비디오 컴프레션, 엘엘씨 이미지들의 멀티-트리 서브-디비젼을 이용한 비디오 코딩
KR102166519B1 (ko) 2010-04-13 2020-10-16 지이 비디오 컴프레션, 엘엘씨 샘플 영역 병합
EP2424117A3 (en) 2010-08-24 2013-01-02 Her Majesty the Queen in Right of Canada, as represented by the Minister of Industry, through The Communications Research Centre Canada Sparse data compression
US8767835B2 (en) * 2010-12-28 2014-07-01 Mitsubishi Electric Research Laboratories, Inc. Method for coding videos using dictionaries
US20120189052A1 (en) * 2011-01-24 2012-07-26 Qualcomm Incorporated Signaling quantization parameter changes for coded units in high efficiency video coding (hevc)
US20140146891A1 (en) * 2011-06-10 2014-05-29 Mediatek Inc. Method and Apparatus of Scalable Video Coding
US9736489B2 (en) 2011-09-17 2017-08-15 Qualcomm Incorporated Motion vector determination for video coding
WO2019229683A1 (en) 2018-05-31 2019-12-05 Beijing Bytedance Network Technology Co., Ltd. Concept of interweaved prediction
WO2019234613A1 (en) 2018-06-05 2019-12-12 Beijing Bytedance Network Technology Co., Ltd. Partition tree with partition into 3 sub-blocks by horizontal and vertical splits
CN113597760A (zh) 2019-01-02 2021-11-02 北京字节跳动网络技术有限公司 视频处理的方法
CN111462766B (zh) * 2020-04-09 2022-04-26 浙江大学 一种基于稀疏编码的听觉脉冲编码方法及系统

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09322159A (ja) * 1996-05-17 1997-12-12 Texas Instr Inc <Ti> 画像の符号化方法
JP2002314428A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 信号符号化方法及び装置並びに復号方法及び装置

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5699121A (en) * 1995-09-21 1997-12-16 Regents Of The University Of California Method and apparatus for compression of low bit rate video signals
GB9802233D0 (en) 1998-02-03 1998-04-01 Nds Ltd Digital signal processing
GB9925947D0 (en) * 1999-11-02 1999-12-29 Elixir Studios Limited Improvements relating to image processing
JP2003518883A (ja) * 1999-12-28 2003-06-10 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ マッチング追跡アルゴリズムに基づくビデオ符号化方法
US7616690B2 (en) * 2000-10-31 2009-11-10 Imec Method and apparatus for adaptive encoding framed data sequences
US7003039B2 (en) * 2001-07-18 2006-02-21 Avideh Zakhor Dictionary generation method for video and image compression

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09322159A (ja) * 1996-05-17 1997-12-12 Texas Instr Inc <Ti> 画像の符号化方法
JP2002314428A (ja) * 2001-04-09 2002-10-25 Ntt Docomo Inc 信号符号化方法及び装置並びに復号方法及び装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013540403A (ja) * 2010-10-14 2013-10-31 トムソン ライセンシング 運動行列を用いた映像の符号化および復号のための方法および装置
US9894354B2 (en) 2010-10-14 2018-02-13 Thomson Licensing Methods and apparatus for video encoding and decoding using motion matrix
US9071346B2 (en) 2013-11-11 2015-06-30 Fujitsu Limited Receiver and receiving method

Also Published As

Publication number Publication date
ZA200508764B (en) 2006-08-30
CN100399357C (zh) 2008-07-02
DE602004001993D1 (de) 2006-09-28
EP1629436A1 (en) 2006-03-01
ATE336763T1 (de) 2006-09-15
US8204109B2 (en) 2012-06-19
EP1629436B8 (en) 2006-10-04
CA2560075A1 (en) 2004-10-07
EP1629436B1 (en) 2006-08-16
RU2335803C2 (ru) 2008-10-10
JP4804342B2 (ja) 2011-11-02
CN1802667A (zh) 2006-07-12
BRPI0408835A (pt) 2006-04-04
WO2004086302A1 (en) 2004-10-07
AU2004223358A1 (en) 2004-10-07
DE602004001993T2 (de) 2007-04-12
US20090103602A1 (en) 2009-04-23
AU2004223358B2 (en) 2010-04-01

Similar Documents

Publication Publication Date Title
JP4804342B2 (ja) オーバーコンプリート基底変換ベースの、動き残差フレーム符号化方法およびビデオ圧縮用装置
JP3013698B2 (ja) ベクトル量子化符号化装置と復号化装置
JP3659353B2 (ja) ビデオ画像符号化方法
JP3876227B2 (ja) 任意の形状のオブジェクトのテクスチャに適用される前処理方法
US6229854B1 (en) Video coding/decoding apparatus
US6639942B1 (en) Method and apparatus for estimating and controlling the number of bits
US5714950A (en) System for variable-length-coding and variable-length-decoding digitaldata
US20040081238A1 (en) Asymmetric block shape modes for motion estimation
US8285064B2 (en) Method for processing images and the corresponding electronic device
KR20010033797A (ko) 스케일 가능한 계층적 움직임 추정을 실행하는 장치 및방법
JP2000511366A6 (ja) 4分割ツリーベースの可変ブロックサイズ動き推定装置および方法
WO2004104930A2 (en) Hybrid video compression method
Li et al. Layered DCT still image compression
KR100242635B1 (ko) 가변장 부호화 및 가변장 복호화 시스템
JP6992825B2 (ja) 映像符号化装置、映像符号化方法、映像復号装置、映像復号方法、及び映像符号化システム
Kuo et al. Multiresolution video coding based on Kalman filtering motion estimation
Efstratiadis et al. Image compression using subband/wavelet transform and adaptive multiple-distribution entropy coding
JP7473017B2 (ja) 映像符号化装置および映像符号化方法
JP5375697B2 (ja) 動画像符号化装置、動画像復号装置、動画像符号化方法、及びプログラム
EP0800684A1 (en) Method and device for encoding/decoding a displaced frame difference
Douda et al. A new approach for improvement of fractal image encoding
Chang et al. Region-based fractal compression for still image
KR100240344B1 (ko) 적응적인 윤곽선 부호화 장치 및 방법
Van Der Auwera et al. A new technique for motion estimation and compensation of the wavelet detail images
Choo et al. Interframe hierarchical vector quantization using hashing-based reorganized codebook

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070329

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100316

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100616

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100623

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100715

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100723

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100730

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110405

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110617

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110712

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110809

R150 Certificate of patent or registration of utility model

Ref document number: 4804342

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140819

Year of fee payment: 3

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250