JP4794147B2 - フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体 - Google Patents

フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体 Download PDF

Info

Publication number
JP4794147B2
JP4794147B2 JP2004262587A JP2004262587A JP4794147B2 JP 4794147 B2 JP4794147 B2 JP 4794147B2 JP 2004262587 A JP2004262587 A JP 2004262587A JP 2004262587 A JP2004262587 A JP 2004262587A JP 4794147 B2 JP4794147 B2 JP 4794147B2
Authority
JP
Japan
Prior art keywords
frame
pixels
pixel
encoding
unconnected
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004262587A
Other languages
English (en)
Other versions
JP2005086834A (ja
Inventor
ジョディ・キャバル
レゼック・シープリンスキー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Electric R&D Centre Europe BV Netherlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Electric R&D Centre Europe BV Netherlands filed Critical Mitsubishi Electric R&D Centre Europe BV Netherlands
Publication of JP2005086834A publication Critical patent/JP2005086834A/ja
Application granted granted Critical
Publication of JP4794147B2 publication Critical patent/JP4794147B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像シーケンスを符号化および復号化する方法に関する。本発明は特に、時間フィルタリングとそれに続く空間フィルタリングを伴う3−Dサブバンド符号化に関する。
Jens-Rainer Ohmによる論文「動き補償を用いた3次元サブバンド符号化(Three-Dimensional Subband Coding with Motion Compensation)」ならびにChoiおよびWoodsによる論文「動き補償されたビデオの3−Dサブバンド符号化(Motion-Compensated 3-D Subband Coding of Video)」は、3−Dサブバンド符号化を記載する参考文献である。簡単に言えば、ビデオシーケンス中のピクチャグループ(Group of Pictures、GOP)等の画像シーケンスを、動き補償(MC)時間解析とその後の空間ウェーブレット変換(spatial wavelet transform)によって時空間サブバンドに分解する。結果として得られるサブバンド(係数)をさらに送信のために符号化する。
図1および図2を参照して3−Dサブバンド符号化システムの一例をより詳細に後述する。
図1は、3−Dサブバンド符号化器の一例である動き補償埋め込みゼロブロック(zeroblock)符号化器(MC−EZBC)のブロック図である。この符号化器は、動き補償時間フィルタリング(MCTF)モジュール10を含む。このMCTFモジュール10の出力は、空間変換モジュール12および動き推定モジュール18に接続される。空間変換モジュールの出力は埋め込みゼロブロック(EZBC)モジュール14に接続される。動き推定モジュール18の出力の1つはMCTFモジュール10に入力され、もう1つの出力は動きベクトル符号化モジュール20に接続される。EZBCモジュール14および動きベクトル符号化モジュール20の出力はいずれもパケット化モジュール16に接続され、パケット化モジュール16は、送信される圧縮ビデオデータを出力する。
GOP(通常16フレーム)は、MCTFが行われるMCTFモジュール10に入力される。動き推定モジュール18とともに、フレームに対して動き推定が行われる。この例において、動き推定は、階層的可変サイズブロックマッチング(HVSBM)を用いた逆方向動き推定である。このスキームでは、動き推定は先ず大きなブロック(64×64画素)で行われる。次に各ブロックを4つのサブブロックに分割する。大きなブロックの動きベクトルを精緻化することによってサブブロックの動きベクトルを生成する。これを、最小ブロックサイズ(4×4)の画素に達するまで繰り返す。レート歪最適化(rate-distortion optimisation)において枝刈り(pruning)プロセスを行った後、可変ブロックサイズのグリッドを得て、結果として得られる動きベクトルを、対応するブロック内の全ての画素に割り当てる。
次に、MCTFモジュール10は、動き推定モジュール18から入力された動きベクトルを用いて時間フィルタリングを行う。この例において、時間フィルタリングは、ハール時間ウェーブレット変換(Haar temporal wavelet transform)(リフティングスキーム)(lifting scheme)を用いて実施され、図2に示すような階層的時間分解を生じる。
より具体的には、図2を参照して、適切な変換を用いてGOP内の連続するフレームAおよびBの各ペアに対して操作を行い、低域通過フィルタリングされたフレームおよび高域通過フィルタリングされたフレームを生じ、第1階層のサブバンドを生成する。GOP全体では、これにより、8個の低域通過フィルタリングされたフレーム(t−L)および8個の高域通過フィルタリングされたフレーム(t−H)が生じる。
低域通過フィルタリングされたフレームを用いてこの手順(動き推定および変換)を繰り返して、4つの低域通過フィルタリングされたフレーム(t−LL)および4つの高域通過フィルタリングされたフレーム(t−LH)を生じる。同様に、この手順を低域時間サブバンド(low temporal subband)に対して、残りの低域時間サブバンドフレームが1つだけになるまで再帰的に繰り返す。図2に示すように、この結果、t−LLLLフレームを1つ、t−LLLHフレームを1つ、t−LLHフレームとt−LLLフレームを2つずつ、t−LLフレームとt−LHフレームを4つずつ、t−Hフレームとt−Lフレームを8つずつ有する4階層に分解される。
時間段階の後には空間変換モジュール12における空間分解が続く。より具体的には、図2に示す分解における明るい各時間サブバンドフレームには、ウェーブレット変換を用いた空間フィルタリングおよび分解が施される。J. M. Shapiroによる論文「ウェーブレット係数のゼロツリーを用いた埋め込み画像符号化(Embedded Image Coding using Zerotrees of Wavelets Coefficients)」(1993年12月)は、画像フレームへのウェーブレット変換の適用を記載する。簡単に言えば、空間分解は、図2に示す時間フィルタリングの構造と同様の階層的分解を結果として生じる。
概して、時空間フィルタリングは、それぞれが各画素位置の係数からなるフィルタリングされたフレームの階層配列を結果として生じる。
US6,519,284は、階層的サブバンド符号化を例示および説明する。
3−Dサブバンド係数は、EZBCモジュール14において空間的に符号化される。全ての時空間サブバンドは別々に符号化される。
動き推定モジュール18によって出力される動きベクトルフィールドは、動きベクトル符号化モジュール20によってロスレス予測および適応算術符号化を用いて符号化される。
パケット化モジュールは、符号化されたサブバンド係数と符号化された動きベクトルフィールドとを組み合わせる。最終的な出力ビットストリームを形成するためのビットプレーンの走査において、GOPの全ての時間サブバンドフレームの空間サブバンドはインタリーブされる。ビットストリームの動きベクトル部分は非スケーラブルなやり方で別々に格納される。
上記の動き推定ステップにおいて、動きベクトルは、予測/現フレームの各画素に割り当てられる(図3に示すように、逆方向動き推定を用いた連続するフレームAおよびBの場合、予測フレームはフレームBであり、基準フレームはフレームAである)。動きベクトルは、変位(displaced)フレーム差(DFD)、すなわちフレームBの画素と、動きベクトルによって特定されるフレームAの対応画素との画素値の差に基づいて、フレームBの画素とフレームAの画素の間の良好な一致を表す場合も表さない場合もある。2つの不一致の画素を用いた時間フィルタリングは、エネルギーの高いDFDおよびフレームレートが低く視覚品質の悪いビデオを含む問題を結果として生じる。
動き補償に伴う主な問題は、フレーム間の関係が動きモデルによって常に完全に記述できるとは限らないことである。これはブロックに基づくモデルの場合、遮蔽、カメラズームまたはパン等の場合に起こるような、動きが区分的に並進(piecewise translational)でないときはいつでも当てはまる。そのような領域において、画素は、未連結(unconnected)(カバーされていない、動きベクトルが不確定)または多重連結(カバーされている、フレームBのいくつかの画素がフレームAの同一画素を指す動きベクトルを有する可能性がある)として分類することができる。そのような非連結(disconnected)領域では動き補償の効果は期待できない。
不一致の画素間での動きフィルタリングを避けるために、フレームAおよびBの対応画素間のDFDを所定の閾値と比較する。割り当てられた動きベクトルのDFDが閾値を越える画素の場合、動きベクトルは誤りとみなされ、その画素は未連結(動きベクトルが不確定)として処理される。例えば、DFD平均二乗誤差(MSE)がスケーリングした分散よりも大きい画素は未連結として分類される。
多重連結画素(予測フレーム(フレームB)にいくつかの対応画素があるフレームAの画素)の場合、各動きベクトルのDFDの絶対値を計算し、動きベクトルと、関連するDFDが最小であるフレームBの関連画素とを選択する。フレームAの同一画素を示すフレームBの他の画素は未連結として処理する。
図3において、画素b8およびa2は未連結であり、画素a5は多重連結であり、残りの画素は連結されている。a5/b4のDFDがa5/b5のDFDよりも大きいと仮定すると、a5とb5の間の動きベクトルが保持され、b4が未連結として処理される。
多重連結画素および未連結画素の問題は、上記のOhmの論文およびChoiおよびWoodsの論文、ならびにWO02/085026および同様にカバーされている/カバーされていない画像領域を例示するUS6,381,276で議論されている。
上記ハール時間ウェーブレット変換の詳細を以下に示す。
2つの連続するフレームAおよびBについて、高域通過フィルタリングは次のように表される。
H(m,n)=(√2/2)×[B(m,n)−A(m−k,n−l)]
ここで、A(基準フレーム)およびB(現フレーム)は元のフレームであり、Hは高域通過フィルタリングされたフレームであり、mおよびnは画素のインデックスであり、kおよびlは動きベクトルである。
低域通過フィルタリングは、連結画素に適応され、
L(m,n)=H(m+k,n+l)+√2×A(m,n)
であり、また、未連結(カバーされている/カバーされていない)画素に適応され、
L(m,n)=√2×A(m,n)
である。
復号化器において、LおよびHを用いることにより、同一の補間をHに対して行い、Aを連結画素について次のように正確に再構築し、
A(m,n)=(l/√2)×[L(m,n)−H(m+k,n+l)]
また、Aを未連結(カバーされている/カバーされていない)画素について次のように再構築する。
A(m,n)=(l/√2)×L(m,n)
Aが得られたら、同一の補間をAに対して行い、Bを次のように正確に再構築することができる。
B(m,n)=√2×H(m,n)+A(m−k,n−l)
未連結ブロックを符号化するために、従来技術のアルゴリズムは、セグメント化された(segmented)未連結ブロックに対して順方向動き推定を行う。この結果、特定のブロックのDFDが低くなった場合、順方向動き補償予測(MCP)を用いる。そうでない場合、デフォルトの逆方向MCPを用いる。これで次の3種類の符号化モードが得られる。
・デフォルト(連結ブロック)
・INTRA(逆方向MCPを用いる未連結ブロック)
・REVERSE(順方向MCPを用いる未連結ブロック)
この3種類の場合はそれぞれ、0、10および11の3シンボルのハフマン符号を用いて表され、動きベクトルとともにオーバーヘッド情報として送信される。MCPはINTRAブロックおよびREVERSEブロックに対してMCTFの代わりに用いられるため、本来INTRAブロックおよびREVERSEブロックとして選択された現フレーム内のブロックは低域通過時間フィルタリングされない。
可変長符号化は、動きベクトルを符号化するために用いられる。これは、動きベクトルの分布が均一でないからである。動きベクトルはベクトル差の適応算術符号化によってビットストリームに変換される。
3−Dサブバンド係数はEZBCを用いて符号化される。EZBCは、サブバンド/ウェーブレット係数のゼロブロック符号化およびコンテキストモデリングを用いた埋め込み画像符号化アルゴリズムである。各フレームは別々に空間符号化され、結果として生じたビットストリームはパケット化モジュールに渡される。
画像シーケンスを符号化する代替的な技法(MPEG−2、MPEG−4、H.263、H.264)には、動き推定/補償および空間変換符号化がある。一部のフレーム(Iフレーム)は動き推定を用いずにフレーム内符号化される(intra-coded)。他のフレーム(BフレームおよびPフレーム)は、ブロック動き補償および結果として生じる差分ブロックの空間符号化を伴う。ブロックのフレーム内符号化(intra coding)もまた、動き推定において適切な動きベクトルが見つからなかった場合にBフレームおよびPフレームにおいて実行されることができる。フレーム内符号化の効率を上げるために、所与のフレームにおける隣接ブロック間の空間補正を利用することができる。特に、MPEG−4 AVC/H.264コーデック(codec)では、関心のブロックを周囲のブロックから方向情報に従って予測することができる。次に実際のブロックとその予測の間の差を符号化するため、このブロックの動きベクトルは符号化および送信する必要がない。
MC−EZBCおよびフレーム間ウェーブレット符号化器全般の問題の1つは、主に動きベクトルがスケーラブルでないことにより、低ビットレートでの性能が比較的低いことである。
また例えば、現在のフレーム間ウェーブレットビデオ符号化の手法では、隣接フレームの不一致(poor match)が、動き補償予測を用いて、良好な一致と同様に時間フィルタリングされて高域通過時間フレームとなり、それらのフレーム(またはフレーム内のブロック)の品質を悪化させる。これは、動き推定により隣接フレーム間の対応物が見つからない不一致の場合、基準フレームからの予測として用いられるブロックが予測されるべきブロックと著しく異なるためである。
本発明の態様は添付の特許請求の範囲に記載される。
本発明は、時間フィルタリングを伴う3−Dサブバンド分解を用いてフレームシーケンスを符号化および復号化する方法を提供し、本方法は時間分解において、特定の条件下で、少なくとも1つの画素について、同一フレーム内の1つまたは複数の他の画素の値を用いて上記画素の値を近似または予測することを特徴とする。時間フィルタリングは、1つのフレームの動きベクトルフィールドを導出すること、および少なくとも2つのフレームを時間フィルタリングに関与させることを伴う。近似した画素値は、(時間)サブバンド分解の高域通過または低域通過フレームのいずれかで上記画素を表すために用いることができる。
好ましくは、上記画素は、同一フレーム内の1つまたは複数の近傍画素、またはそれらの組み合わせを用いて近似される。所与の画素について、近傍画素は、上記画素を直に取り巻く画素のうちのいずれかであってよい。あるいは、例えば可変ブロックサイズマッチングにおいて動きベクトルを求める際に用いられるブロック等の画素ブロック(例えば4×4ブロック)内の画素、または全てが同じ動きベクトルを有する画素のブロックまたはグループ、または連結あるいはセグメント化された画素のブロックまたはグループについて、近傍画素を、上記画素のブロックまたはグループに隣接するかまたはそれを取り巻く画素と考えてもよい。
この「フレーム内」(intra)予測は、例えば未連結画素に、あるいは同一フレームを用いた予測から結果として得られたDFDが動き補償予測を用いた場合よりも低い場合に用いることができる。そうでなければ、標準的な時間フィルタリングを用いることができる。
本明細書において、「フレーム」という用語は、フィルタリング後のものを含む画像単位を説明するために用いられるが、この用語は、画像、フィールド、ピクチャ、または画像・フレーム等のサブユニットまたは領域等の他の同様の専門用語にも当てはまる。画素および画素のブロックまたはグループという用語は必要に応じて置き換え可能に用いられる場合がある。
添付図面を参照して本発明の1実施形態を説明する。
本発明は、上述の従来技術のシステムと同様のシステムを用い、後述の変更を施して実施することができる。
したがって、本実施形態による符号化システムの基本的な構成要素は図1に示す通りであり、従来技術に関して上述したように動作する。ただし、MCTFモジュールは未連結画素または未連結画素ブロックの処理に関して変更される。
上記のように、動き推定は、4×4の画素ブロックサイズまで行われ、ブロック内の各画素には同一の動きベクトルが割り当てられる。このような4×4の画素ブロックを図4に示す。図4中、c(m,n)は検討中のブロックの画素を表す。近傍画素は、4×4ブロックの一番上の行の上の行の画素がt(p,q)で、4×4ブロックの左の列の左側の列の画素がl(r,s)で表される。
動きベクトルを求めた後、従来技術と同様に動きベクトルおよび関連するDFDを処理して、どの画素を未連結(上で定義)として処理すべきかを判定する。
ブロック内の任意の未連結画素について、当該画素をさらなる処理のために、同一フレーム内の隣接画素を用いて近似(または予測)する(以下でフレーム内予測として説明する)。これはいくつかの方法で実施することができる。
この例では3種類のフレーム内モード、すなわち垂直方向フレーム内予測モード、水平方向フレーム内予測モードおよび水平方向−垂直方向平均フレーム内予測モードがある。
垂直方向フレーム内予測モード:
・t(0,−1)によりc(0,0)、c(0,1)、c(0,2)およびc(0,3)を予測する
・t(1,−1)によりc(1,0)、c(1,1)、c(1,2)およびc(1,3)を予測する
・t(2,−1)によりc(2,0)、c(2,1)、c(2,2)およびc(2,3)を予測する
・t(3,−1)によりc(3,0)、c(3,1)、c(3,2)およびc(3,3)を予測する
水平方向フレーム内予測モード:
・l(−1,0)によりc(0,0)、c(1,0)、c(2,0)およびc(3,0)を予測する
・l(−1,1)によりc(0,1)、c(1,1)、c(2,1)およびc(3,1)を予測する
・l(−1,2)によりc(0,2)、c(1,2)、c(2,2)およびc(3,2)を予測する
・l(−1,3)によりc(0,3)、c(1,3)、c(2,3)およびc(3,3)を予測する
水平方向−垂直方向平均フレーム内予測モード:
・(t(0,−1)+l(−1,0))/2によりc(0,0)を予測する
・(t(1,−1)+l(−1,0))/2によりc(1,0)を予測する
・(t(2,−1)+l(−1,0))/2によりc(2,0)を予測する
・(t(3,−1)+l(−1,0))/2によりc(3,0)を予測する
・(t(0,−1)+l(−1,1))/2によりc(0,1)を予測する
・(t(1,−1)+l(−1,1))/2によりc(1,1)を予測する
・(t(2,−1)+l(−1,1))/2によりc(2,1)を予測する
・(t(3,−1)+l(−1,1))/2によりc(3,1)を予測する
・(t(0,−1)+l(−1,2))/2によりc(0,2)を予測する
・(t(1,−1)+l(−1,2))/2によりc(1,2)を予測する
・(t(2,−1)+l(−1,2))/2によりc(2,2)を予測する
・(t(3,−1)+l(−1,2))/2によりc(3,2)を予測する
・(t(0,−1)+l(−1,3))/2によりc(0,3)を予測する
・(t(1,−1)+l(−1,3))/2によりc(1,3)を予測する
・(t(2,−1)+l(−1,3))/2によりc(2,3)を予測する
・(t(3,−1)+l(−1,3))/2によりc(3,3)を予測する
本システムは、どの予測モードが好ましいかについて設定することができる。その場合、用いられている予測モードの予測値が得られない場合(例えば垂直方向フレーム内予測モードにおいて関連するt(p,q)の値が得られない場合)、システムは、代替的な予測モード(例えば水平方向予測モード)を用いるように設定することができる。他の予測モードの予測値が得られない場合、128という予測値を用いる。
フレーム内予測モードを用いる場合、2つの連続フレームB(現)およびA(参照)の対応ブロックのリフティングの実施態様において、動き補償時間フィルタリング(MCTF)をわずかに変更する。高域通過フィルタリングHを未連結画素に次式により適応する。
H(m,n)=(√2/2)×[B(m,n)−B’(m,n)]
ここでB’(m,n)は、上記のようなフレーム内予測を用いた現フレーム内の予測画素である。連結画素の高域通過フィルタリングおよび低域通過フィルタリングはそのままである。
次に現フレームを未連結画素について次式により再構築する。
B(m,n)=√2×H(m,n)+B’(m,n)
ここでB’(m,n)は以前の再構築画素である。残りの再構築の式は変更されない。
このフレーム内予測手法を用いることによって、用いられる予測値が動き推定プロセスを用いる場合よりも予測されるべき画素値に近くなるため、高域通過時間フレームが改善する。最良の結果を得るには、フレーム内予測モードを動き推定プロセスに基づくMC予測と比較して、最も低い平均歪値をもたらすモード(フレーム内予測またはMC予測)を選択する。
より具体的には、全てのフレーム内予測モード(垂直方向、水平方向および水平方向−垂直方向)およびMC予測モード(逆方向および順方向)の平均絶対差(MAD)の値を計算する。MAD値の最も低いモードを最良の予測モードとして選択する。
本実施形態では、全ての成分、すなわち輝度(luma、Y)および色差(chroma、CbおよびCr)に対して同じ3種類のフレーム内予測モードを用い、それに加えて、各モードにより生じる歪レベルに応じて元のMCPモードを用いる。
可変重み付けパラメータを用いることによって、異なるモードを用いた画素/ブロックの比率を変えることができる。例えば、重み付けパラメータを0に設定することは、すべての未連結画素/ブロックが同一フレームからの画素を予測値として用いて予測されることを意味する可能性があり、重み付けパラメータを上げると、動き補償予測を用いて予測される画素/ブロックの比率が上がる。
上記のフレーム内予想モードは、垂直方向、水平方向および平均予測のみを用いる。しかしながら、様々な他のフレーム内予測を用いることもできる。例えば、MPEG−4 AVCコーデックに規定された全てのモードを用いることができる。それらは、それぞれ垂直方向(モード0)、水平方向(モード1)、DC(モード2)、対角線左下(モード3)、対角線右下(モード4)、垂直方向右(モード5)、水平方向下(モード6)、垂直方向左(モード7)および水平方向上(モード8)予測モードと呼ばれる9種類のフレーム内予測モードである。また、異なるブロックサイズおよび異なる色成分に適用することができる4種類の異なるフレーム内予測モードもある。
図5に示す完全な予測モードの方向セットを以下に示す。
・モード0:Vertical_Up(垂直方向上)
・モード1:Vertical_Up_Right(垂直方向右上)
・モード2:Diagonal_Up_Right(対角線右上)
・モード3:Horizontal_Up_Right(水平方向右上)
・モード4:Horizontal_Right(水平方向右)
・モード5:Horizontal_Down_Right(水平方向右下)
・モード6:Diagonal_Down_Right(対角線右下)
・モード7:Vertical_Down_Right(垂直方向右下)
・モード8:Vertical_Down(垂直方向下)
・モード9:Vertical_Down_Left(垂直方向左下)
・モード10:Diagonal_Down_Left(対角線左下)
・モード11:Horizontal_Down_Left(水平方向左下)
・モード12:Horizontal_Left(水平方向左)
・モード13:Horizotal_Up_Left(水平方向左上)
・モード14:Diagonal_Up_Left(対角線左上)
・モード15:Vertical_Up_Left(垂直方向左上)
・モード16:DC
動き推定では、ブロックサイズの選択はレート歪最適化に基づく。フレーム内予測プロセスは現在、動き推定の後に行われているため、レート歪最適化されていない。フレーム内予測モードの選択は、レート歪最適化に組み込むこともできる。
低域通過フィルタリングされたフレームに対して同様のフレーム内予測プロセスを導入することもできる。
他のタイプの3−D分解および変換を用いてもよい。例えば、本発明は、空間フィルタリングを先に行った後で時間フィルタリングを行う分解スキームに適用することもできる。
本発明は、例えばコンピュータベースのシステムにおいて、あるいは適切なハードウェアおよび/またはソフトウェアを用いて実施することができる。図1には符号化器を示しており、対応する復号化器は、逆の復号化動作を行うための対応する構成要素を有する。
符号化システムのブロック図である。 GOPの時間分解を示す図である。 フレームペアならびに連結画素および未連結画素の図である。 フレーム内の画素配列の図である。 予測画素の選択方向を示す図である。
符号の説明
A,B フレーム、a2,b8 未連結の画素、a5 多重連結の画素、a1,a3,a4,a6〜a9,b1〜b7,b9 連結された画素、c(0,0)〜c(3,3) 検討中の画素、t(0,−1)〜t(3,−1),l(−1,0)〜l(−1,3) 近傍画素。

Claims (12)

  1. 動き補償時間フィルタリングを伴う3−Dサブバンド分解を用いてフレームシーケンスを符号化する方法であって、
    前記動き補償時間フィルタリングは、
    1つのフレームについて動きベクトルを導出することと、
    未連結画素を識別することと、
    前記フレーム内の少なくとも1つの未連結画素について、同一フレーム内の1つまたは複数の画素値に基づいて前記未連結画素の予測値を計算することと、
    前記未連結画素に対する前記動き補償時間フィルタリングにおいて、前記計算された予測画素値を用いることと
    を含む、フレームシーケンスを符号化する方法。
  2. 時空間フィルタリングを伴う3次元(3−D)サブバンド分解を用いる請求項1に記載のフレームシーケンスを符号化する方法。
  3. 前記予測画素は、同一フレーム内の1つまたは複数の近傍画素、またはそれらの組み合わせに基づいて計算される請求項1または請求項2に記載のフレームシーケンスを符号化する方法。
  4. 垂直方向または水平方向の近傍画素に基づいて前記予測画素値を計算する請求項3に記載のフレームシーケンスを符号化する方法。
  5. 前記方法は、1つの未連結画素について複数の予測値を計算することを含み、
    各予測値は、前記未連結画素と同一のフレーム内の1つまたは複数の画素からなるそれぞれ異なる組に基づいて計算され、
    前記方法は、
    前記未連結画素の実際の値と前記予測のそれぞれとの差を比較することと、
    前記未連結画素の前記実際の値に最も近い予測画素値を選択することと
    を含む請求項3または4に記載のフレームシーケンスを符号化する方法。
  6. 動き補償および他のフレーム内の値を用いて前記予測画素値計算することと、
    他のフレーム内の画素に基づいて計算された画素値と同一フレーム内の画素に基づく計算された画素値との結果を比較することと、
    最良の近似値を選択することと
    をさらに含む請求項1〜のいずれか一項に記載のフレームシーケンスを符号化する方法。
  7. 前記計算された予測画素値は、前記サブバンド分解における高域通過または低域通過フレーム内の前記画素を表すために用いられる請求項1〜のいずれか一項に記載のフレームシーケンスを符号化する方法。
  8. 前記サブバンド分解における高域通過または低域通過フレーム内の前記画素を表すことは、前記計算された予測画素値、または前記計算された予測画素値および前記画素値を用いた変換式を伴う請求項に記載のフレームシーケンスを符号化する方法。
  9. 請求項1〜のいずれか一項に記載の方法を用いて符号化されたフレームシーケンスを復号する方法であって、
    同一フレーム内の少なくとも1つの他の画素値を用いてフレームの画素値を再構築することを含む、フレームシーケンスを復号する方法。
  10. 請求項1〜のいずれか一項に記載の方法を実施するようになっている符号化および/または復号装置。
  11. 請求項1〜のいずれか一項に記載の方法をコンピュータに実行させるコンピュータプログラム。
  12. 請求項11に記載のコンピュータプログラムを格納するコンピュータ読み取り可能な記憶媒体。
JP2004262587A 2003-09-09 2004-09-09 フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体 Expired - Fee Related JP4794147B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03255624.3 2003-09-09
EP03255624A EP1515561B1 (en) 2003-09-09 2003-09-09 Method and apparatus for 3-D sub-band video coding

Publications (2)

Publication Number Publication Date
JP2005086834A JP2005086834A (ja) 2005-03-31
JP4794147B2 true JP4794147B2 (ja) 2011-10-19

Family

ID=34130348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004262587A Expired - Fee Related JP4794147B2 (ja) 2003-09-09 2004-09-09 フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体

Country Status (5)

Country Link
US (1) US7881374B2 (ja)
EP (1) EP1515561B1 (ja)
JP (1) JP4794147B2 (ja)
CN (1) CN100411441C (ja)
DE (1) DE60317670T2 (ja)

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI243615B (en) * 2004-10-11 2005-11-11 Ind Tech Res Inst System for enhancing compression ratio of scalable video coding and method thereof
US8571100B2 (en) * 2004-11-04 2013-10-29 Thomson Licensing Fast intra mode prediction for a video encoder
KR100703745B1 (ko) * 2005-01-21 2007-04-05 삼성전자주식회사 비동기 프레임을 효율적으로 예측하는 비디오 코딩 방법 및장치
CA2610276C (en) * 2005-07-22 2013-01-29 Mitsubishi Electric Corporation Image encoder and image decoder, image encoding method and image decoding method, image encoding program and image decoding program, and computer readable recording medium recorded with image encoding program and computer readable recording medium recorded with image decoding program
KR100873636B1 (ko) * 2005-11-14 2008-12-12 삼성전자주식회사 단일 부호화 모드를 이용하는 영상 부호화/복호화 방법 및장치
US9204149B2 (en) * 2006-11-21 2015-12-01 Vixs Systems, Inc. Motion refinement engine with shared memory for use in video encoding and methods for use therewith
US9031129B2 (en) * 2007-06-15 2015-05-12 Microsoft Technology Licensing, Llc Joint spatio-temporal prediction for video coding
US8345968B2 (en) * 2007-06-28 2013-01-01 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
US20090168871A1 (en) * 2007-12-31 2009-07-02 Ning Lu Video motion estimation
WO2009116815A2 (en) * 2008-03-20 2009-09-24 Samsung Electronics Co., Ltd. Apparatus and method for encoding and decoding using bandwidth extension in portable terminal
JP5344238B2 (ja) * 2009-07-31 2013-11-20 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
JP5645589B2 (ja) * 2010-10-18 2014-12-24 三菱電機株式会社 動画像符号化装置
US20120236936A1 (en) * 2011-03-14 2012-09-20 Segall Christopher A Video coding based on edge determination
US9398300B2 (en) * 2011-10-07 2016-07-19 Texas Instruments Incorporated Method, system and apparatus for intra-prediction in video signal processing using combinable blocks
WO2014038330A1 (ja) * 2012-09-06 2014-03-13 ソニー株式会社 画像処理装置及び画像処理方法
CN103108187B (zh) * 2013-02-25 2016-09-28 清华大学 一种三维视频的编码方法、解码方法、编码器和解码器
US20160142593A1 (en) * 2013-05-23 2016-05-19 Thomson Licensing Method for tone-mapping a video sequence
CN104202594B (zh) * 2014-07-25 2016-04-13 宁波大学 一种基于三维小波变换的视频质量评价方法
US11800056B2 (en) 2021-02-11 2023-10-24 Logitech Europe S.A. Smart webcam system
US11800048B2 (en) 2021-02-24 2023-10-24 Logitech Europe S.A. Image generating system with background replacement or modification capabilities

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1997016030A1 (en) * 1995-10-25 1997-05-01 Philips Electronics N.V. Segmented picture coding method and system, and corresponding decoding method and system
US5841473A (en) * 1996-07-26 1998-11-24 Software For Image Compression, N.V. Image sequence compression and decompression
KR20010075232A (ko) 1999-07-20 2001-08-09 요트.게.아. 롤페즈 비디오 시퀀스의 압축을 위한 인코딩 방법
JP2003530789A (ja) * 2000-04-11 2003-10-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ符号化及び復号方法
WO2002001881A2 (en) 2000-06-30 2002-01-03 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
KR20020064786A (ko) * 2000-07-25 2002-08-09 코닌클리케 필립스 일렉트로닉스 엔.브이. 웨이블릿 분해를 사용하는 비디오 인코딩 방법
US7020335B1 (en) * 2000-11-21 2006-03-28 General Dynamics Decision Systems, Inc. Methods and apparatus for object recognition and compression
KR20030014705A (ko) * 2001-04-10 2003-02-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 프레임들의 시퀀스를 인코딩하는 방법
US7042946B2 (en) * 2002-04-29 2006-05-09 Koninklijke Philips Electronics N.V. Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
US7023923B2 (en) * 2002-04-29 2006-04-04 Koninklijke Philips Electronics N.V. Motion compensated temporal filtering based on multiple reference frames for wavelet based coding
US7653133B2 (en) * 2003-06-10 2010-01-26 Rensselaer Polytechnic Institute (Rpi) Overlapped block motion compression for variable size blocks in the context of MCTF scalable video coders

Also Published As

Publication number Publication date
US7881374B2 (en) 2011-02-01
JP2005086834A (ja) 2005-03-31
US20050053132A1 (en) 2005-03-10
CN100411441C (zh) 2008-08-13
CN1595986A (zh) 2005-03-16
DE60317670T2 (de) 2008-10-30
DE60317670D1 (de) 2008-01-03
EP1515561A1 (en) 2005-03-16
EP1515561B1 (en) 2007-11-21

Similar Documents

Publication Publication Date Title
JP4794147B2 (ja) フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体
JP4786534B2 (ja) マルチビュービデオを分解する方法及びシステム
US8873623B2 (en) Apparatus and method for generating a coded video sequence and for decoding a coded video sequence by using an intermediate layer residual value prediction
US8588536B2 (en) Guaranteed-rate tiled image data compression
US20060093041A1 (en) Intra-frame prediction for high-pass temporal-filtered frames in wavelet video coding
JP2008522537A (ja) 多階層基盤のビデオエンコーディング方法、デコーディング方法及び前記方法を利用した装置
WO2011013253A1 (ja) 幾何変換動き補償予測を用いる予測信号生成装置、動画像符号化装置及び動画像復号化装置
CN1722836A (zh) 视频编码和解码方法以及视频编码器和解码器
CN1695381A (zh) 在数字视频信号的后处理中使用编码信息和局部空间特征的清晰度增强
JP7384974B2 (ja) 適応乗算係数を用いた画像フィルタリングのための方法および装置
JP2005515729A (ja) ビデオ符号化方法
WO2006059848A1 (en) Method and apparatus for multi-layered video encoding and decoding
KR101529903B1 (ko) 블록기반 깊이정보 맵의 코딩 방법과 장치, 및 이를 이용한 3차원 비디오 코딩 방법
Song et al. Improving lossless intra coding of H. 264/AVC by pixel-wise spatial interleave prediction
JP2006501750A (ja) ウェーブレットベースの符号化において、動き補償された時間フィルタリングのための、フィルタリングされた領域とフィルタリングされない領域とを両方備えるlフレーム
Liu et al. New and efficient interframe extensions of EZBC and JPEG 2000
Bhojani et al. Hybrid video compression standard
KR20110087871A (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR102111437B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
KR100801155B1 (ko) H.264에서의 저복잡도를 가지는 공간적 에러 은닉방법
WO2005009045A1 (en) Encoding method and device
Ezhilarasan et al. A hybrid transformation technique for advanced video coding
WO2020248099A1 (en) Perceptual adaptive quantization and rounding offset with piece-wise mapping function
Wang et al. Spatial-temporal decorrelation for image/video coding
JP3930259B2 (ja) インターレース信号符号化装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110726

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees