JP2005086834A - フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体 - Google Patents

フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体 Download PDF

Info

Publication number
JP2005086834A
JP2005086834A JP2004262587A JP2004262587A JP2005086834A JP 2005086834 A JP2005086834 A JP 2005086834A JP 2004262587 A JP2004262587 A JP 2004262587A JP 2004262587 A JP2004262587 A JP 2004262587A JP 2005086834 A JP2005086834 A JP 2005086834A
Authority
JP
Japan
Prior art keywords
frame
pixel
frame sequence
encoding
pixels
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2004262587A
Other languages
English (en)
Other versions
JP4794147B2 (ja
Inventor
Jordi Caball
ジョディ・キャバル
Leszek Cieplinski
レゼック・シープリンスキー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Mitsubishi Elecric Information Technology Centre Europe BV
Mitsubishi Electric Information Technology Corp
Mitsubishi Electric R&D Centre Europe BV Netherlands
Original Assignee
Mitsubishi Elecric Information Technology Centre Europe BV
Mitsubishi Electric Information Technology Corp
Mitsubishi Electric Information Technology Center Europe BV Nederlands
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mitsubishi Elecric Information Technology Centre Europe BV, Mitsubishi Electric Information Technology Corp, Mitsubishi Electric Information Technology Center Europe BV Nederlands filed Critical Mitsubishi Elecric Information Technology Centre Europe BV
Publication of JP2005086834A publication Critical patent/JP2005086834A/ja
Application granted granted Critical
Publication of JP4794147B2 publication Critical patent/JP4794147B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • H04N19/615Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding using motion compensated temporal filtering [MCTF]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/70Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by syntax aspects related to video coding, e.g. related to compression standards
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/13Adaptive entropy coding, e.g. adaptive variable length coding [AVLC] or context adaptive binary arithmetic coding [CABAC]

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】フレームシーケンスを符号化および復号する方法において、フレームの品質を向上させる方法を提供する。
【解決手段】本方法は、時間フィルタリングを伴う3−Dサブバンド分解を用いる。特定の条件下で、少なくとも1つの画素について、同一フレーム内の1つまたは複数の画素値を用いて上記画素の値を近似する。空間フィルタリングを伴ってもよい。画素の近似には、近傍画素またはその組み合わせを用いてもよい。近傍画素は、垂直方向または水平方向のものを用いてもよい。
【選択図】図1

Description

本発明は、画像シーケンスを符号化および復号化する方法に関する。本発明は特に、時間フィルタリングとそれに続く空間フィルタリングを伴う3−Dサブバンド符号化に関する。
Jens-Rainer Ohmによる論文「動き補償を用いた3次元サブバンド符号化(Three-Dimensional Subband Coding with Motion Compensation)」ならびにChoiおよびWoodsによる論文「動き補償されたビデオの3−Dサブバンド符号化(Motion-Compensated 3-D Subband Coding of Video)」は、3−Dサブバンド符号化を記載する参考文献である。簡単に言えば、ビデオシーケンス中のピクチャグループ(Group of Pictures、GOP)等の画像シーケンスを、動き補償(MC)時間解析とその後の空間ウェーブレット変換(spatial wavelet transform)によって時空間サブバンドに分解する。結果として得られるサブバンド(係数)をさらに送信のために符号化する。
図1および図2を参照して3−Dサブバンド符号化システムの一例をより詳細に後述する。
図1は、3−Dサブバンド符号化器の一例である動き補償埋め込みゼロブロック(zeroblock)符号化器(MC−EZBC)のブロック図である。この符号化器は、動き補償時間フィルタリング(MCTF)モジュール10を含む。このMCTFモジュール10の出力は、空間変換モジュール12および動き推定モジュール18に接続される。空間変換モジュールの出力は埋め込みゼロブロック(EZBC)モジュール14に接続される。動き推定モジュール18の出力の1つはMCTFモジュール10に入力され、もう1つの出力は動きベクトル符号化モジュール20に接続される。EZBCモジュール14および動きベクトル符号化モジュール20の出力はいずれもパケット化モジュール16に接続され、パケット化モジュール16は、送信される圧縮ビデオデータを出力する。
GOP(通常16フレーム)は、MCTFが行われるMCTFモジュール10に入力される。動き推定モジュール18とともに、フレームに対して動き推定が行われる。この例において、動き推定は、階層的可変サイズブロックマッチング(HVSBM)を用いた逆方向動き推定である。このスキームでは、動き推定は先ず大きなブロック(64×64画素)で行われる。次に各ブロックを4つのサブブロックに分割する。大きなブロックの動きベクトルを精緻化することによってサブブロックの動きベクトルを生成する。これを、最小ブロックサイズ(4×4)の画素に達するまで繰り返す。レート歪最適化(rate-distortion optimisation)において枝刈り(pruning)プロセスを行った後、可変ブロックサイズのグリッドを得て、結果として得られる動きベクトルを、対応するブロック内の全ての画素に割り当てる。
次に、MCTFモジュール10は、動き推定モジュール18から入力された動きベクトルを用いて時間フィルタリングを行う。この例において、時間フィルタリングは、ハール時間ウェーブレット変換(Haar temporal wavelet transform)(リフティングスキーム)(lifting scheme)を用いて実施され、図2に示すような階層的時間分解を生じる。
より具体的には、図2を参照して、適切な変換を用いてGOP内の連続するフレームAおよびBの各ペアに対して操作を行い、低域通過フィルタリングされたフレームおよび高域通過フィルタリングされたフレームを生じ、第1階層のサブバンドを生成する。GOP全体では、これにより、8個の低域通過フィルタリングされたフレーム(t−L)および8個の高域通過フィルタリングされたフレーム(t−H)が生じる。
低域通過フィルタリングされたフレームを用いてこの手順(動き推定および変換)を繰り返して、4つの低域通過フィルタリングされたフレーム(t−LL)および4つの高域通過フィルタリングされたフレーム(t−LH)を生じる。同様に、この手順を低域時間サブバンド(low temporal subband)に対して、残りの低域時間サブバンドフレームが1つだけになるまで再帰的に繰り返す。図2に示すように、この結果、t−LLLLフレームを1つ、t−LLLHフレームを1つ、t−LLHフレームとt−LLLフレームを2つずつ、t−LLフレームとt−LHフレームを4つずつ、t−Hフレームとt−Lフレームを8つずつ有する4階層に分解される。
時間段階の後には空間変換モジュール12における空間分解が続く。より具体的には、図2に示す分解における明るい各時間サブバンドフレームには、ウェーブレット変換を用いた空間フィルタリングおよび分解が施される。J. M. Shapiroによる論文「ウェーブレット係数のゼロツリーを用いた埋め込み画像符号化(Embedded Image Coding using Zerotrees of Wavelets Coefficients)」(1993年12月)は、画像フレームへのウェーブレット変換の適用を記載する。簡単に言えば、空間分解は、図2に示す時間フィルタリングの構造と同様の階層的分解を結果として生じる。
概して、時空間フィルタリングは、それぞれが各画素位置の係数からなるフィルタリングされたフレームの階層配列を結果として生じる。
US6,519,284は、階層的サブバンド符号化を例示および説明する。
3−Dサブバンド係数は、EZBCモジュール14において空間的に符号化される。全ての時空間サブバンドは別々に符号化される。
動き推定モジュール18によって出力される動きベクトルフィールドは、動きベクトル符号化モジュール20によってロスレス予測および適応算術符号化を用いて符号化される。
パケット化モジュールは、符号化されたサブバンド係数と符号化された動きベクトルフィールドとを組み合わせる。最終的な出力ビットストリームを形成するためのビットプレーンの走査において、GOPの全ての時間サブバンドフレームの空間サブバンドはインタリーブされる。ビットストリームの動きベクトル部分は非スケーラブルなやり方で別々に格納される。
上記の動き推定ステップにおいて、動きベクトルは、予測/現フレームの各画素に割り当てられる(図3に示すように、逆方向動き推定を用いた連続するフレームAおよびBの場合、予測フレームはフレームBであり、基準フレームはフレームAである)。動きベクトルは、変位(displaced)フレーム差(DFD)、すなわちフレームBの画素と、動きベクトルによって特定されるフレームAの対応画素との画素値の差に基づいて、フレームBの画素とフレームAの画素の間の良好な一致を表す場合も表さない場合もある。2つの不一致の画素を用いた時間フィルタリングは、エネルギーの高いDFDおよびフレームレートが低く視覚品質の悪いビデオを含む問題を結果として生じる。
動き補償に伴う主な問題は、フレーム間の関係が動きモデルによって常に完全に記述できるとは限らないことである。これはブロックに基づくモデルの場合、遮蔽、カメラズームまたはパン等の場合に起こるような、動きが区分的に並進(piecewise translational)でないときはいつでも当てはまる。そのような領域において、画素は、未連結(unconnected)(カバーされていない、動きベクトルが不確定)または多重連結(カバーされている、フレームBのいくつかの画素がフレームAの同一画素を指す動きベクトルを有する可能性がある)として分類することができる。そのような非連結(disconnected)領域では動き補償の効果は期待できない。
不一致の画素間での動きフィルタリングを避けるために、フレームAおよびBの対応画素間のDFDを所定の閾値と比較する。割り当てられた動きベクトルのDFDが閾値を越える画素の場合、動きベクトルは誤りとみなされ、その画素は未連結(動きベクトルが不確定)として処理される。例えば、DFD平均二乗誤差(MSE)がスケーリングした分散よりも大きい画素は未連結として分類される。
多重連結画素(予測フレーム(フレームB)にいくつかの対応画素があるフレームAの画素)の場合、各動きベクトルのDFDの絶対値を計算し、動きベクトルと、関連するDFDが最小であるフレームBの関連画素とを選択する。フレームAの同一画素を示すフレームBの他の画素は未連結として処理する。
図3において、画素b8およびa2は未連結であり、画素a5は多重連結であり、残りの画素は連結されている。a5/b4のDFDがa5/b5のDFDよりも大きいと仮定すると、a5とb5の間の動きベクトルが保持され、b4が未連結として処理される。
多重連結画素および未連結画素の問題は、上記のOhmの論文およびChoiおよびWoodsの論文、ならびにWO02/085026および同様にカバーされている/カバーされていない画像領域を例示するUS6,381,276で議論されている。
上記ハール時間ウェーブレット変換の詳細を以下に示す。
2つの連続するフレームAおよびBについて、高域通過フィルタリングは次のように表される。
H(m,n)=(√2/2)×[B(m,n)−A(m−k,n−l)]
ここで、A(基準フレーム)およびB(現フレーム)は元のフレームであり、Hは高域通過フィルタリングされたフレームであり、mおよびnは画素のインデックスであり、kおよびlは動きベクトルである。
低域通過フィルタリングは、連結画素に適応され、
L(m,n)=H(m+k,n+l)+√2×A(m,n)
であり、また、未連結(カバーされている/カバーされていない)画素に適応され、
L(m,n)=√2×A(m,n)
である。
復号化器において、LおよびHを用いることにより、同一の補間をHに対して行い、Aを連結画素について次のように正確に再構築し、
A(m,n)=(l/√2)×[L(m,n)−H(m+k,n+l)]
また、Aを未連結(カバーされている/カバーされていない)画素について次のように再構築する。
A(m,n)=(l/√2)×L(m,n)
Aが得られたら、同一の補間をAに対して行い、Bを次のように正確に再構築することができる。
B(m,n)=√2×H(m,n)+A(m−k,n−l)
未連結ブロックを符号化するために、従来技術のアルゴリズムは、セグメント化された(segmented)未連結ブロックに対して順方向動き推定を行う。この結果、特定のブロックのDFDが低くなった場合、順方向動き補償予測(MCP)を用いる。そうでない場合、デフォルトの逆方向MCPを用いる。これで次の3種類の符号化モードが得られる。
・デフォルト(連結ブロック)
・INTRA(逆方向MCPを用いる未連結ブロック)
・REVERSE(順方向MCPを用いる未連結ブロック)
この3種類の場合はそれぞれ、0、10および11の3シンボルのハフマン符号を用いて表され、動きベクトルとともにオーバーヘッド情報として送信される。MCPはINTRAブロックおよびREVERSEブロックに対してMCTFの代わりに用いられるため、本来INTRAブロックおよびREVERSEブロックとして選択された現フレーム内のブロックは低域通過時間フィルタリングされない。
可変長符号化は、動きベクトルを符号化するために用いられる。これは、動きベクトルの分布が均一でないからである。動きベクトルはベクトル差の適応算術符号化によってビットストリームに変換される。
3−Dサブバンド係数はEZBCを用いて符号化される。EZBCは、サブバンド/ウェーブレット係数のゼロブロック符号化およびコンテキストモデリングを用いた埋め込み画像符号化アルゴリズムである。各フレームは別々に空間符号化され、結果として生じたビットストリームはパケット化モジュールに渡される。
画像シーケンスを符号化する代替的な技法(MPEG−2、MPEG−4、H.263、H.264)には、動き推定/補償および空間変換符号化がある。一部のフレーム(Iフレーム)は動き推定を用いずにフレーム内符号化される(intra-coded)。他のフレーム(BフレームおよびPフレーム)は、ブロック動き補償および結果として生じる差分ブロックの空間符号化を伴う。ブロックのフレーム内符号化(intra coding)もまた、動き推定において適切な動きベクトルが見つからなかった場合にBフレームおよびPフレームにおいて実行されることができる。フレーム内符号化の効率を上げるために、所与のフレームにおける隣接ブロック間の空間補正を利用することができる。特に、MPEG−4 AVC/H.264コーデック(codec)では、関心のブロックを周囲のブロックから方向情報に従って予測することができる。次に実際のブロックとその予測の間の差を符号化するため、このブロックの動きベクトルは符号化および送信する必要がない。
MC−EZBCおよびフレーム間ウェーブレット符号化器全般の問題の1つは、主に動きベクトルがスケーラブルでないことにより、低ビットレートでの性能が比較的低いことである。
また例えば、現在のフレーム間ウェーブレットビデオ符号化の手法では、隣接フレームの不一致(poor match)が、動き補償予測を用いて、良好な一致と同様に時間フィルタリングされて高域通過時間フレームとなり、それらのフレーム(またはフレーム内のブロック)の品質を悪化させる。これは、動き推定により隣接フレーム間の対応物が見つからない不一致の場合、基準フレームからの予測として用いられるブロックが予測されるべきブロックと著しく異なるためである。
本発明の態様は添付の特許請求の範囲に記載される。
本発明は、時間フィルタリングを伴う3−Dサブバンド分解を用いてフレームシーケンスを符号化および復号化する方法を提供し、本方法は時間分解において、特定の条件下で、少なくとも1つの画素について、同一フレーム内の1つまたは複数の他の画素の値を用いて上記画素の値を近似または予測することを特徴とする。時間フィルタリングは、1つのフレームの動きベクトルフィールドを導出すること、および少なくとも2つのフレームを時間フィルタリングに関与させることを伴う。近似した画素値は、(時間)サブバンド分解の高域通過または低域通過フレームのいずれかで上記画素を表すために用いることができる。
好ましくは、上記画素は、同一フレーム内の1つまたは複数の近傍画素、またはそれらの組み合わせを用いて近似される。所与の画素について、近傍画素は、上記画素を直に取り巻く画素のうちのいずれかであってよい。あるいは、例えば可変ブロックサイズマッチングにおいて動きベクトルを求める際に用いられるブロック等の画素ブロック(例えば4×4ブロック)内の画素、または全てが同じ動きベクトルを有する画素のブロックまたはグループ、または連結あるいはセグメント化された画素のブロックまたはグループについて、近傍画素を、上記画素のブロックまたはグループに隣接するかまたはそれを取り巻く画素と考えてもよい。
この「フレーム内」(intra)予測は、例えば未連結画素に、あるいは同一フレームを用いた予測から結果として得られたDFDが動き補償予測を用いた場合よりも低い場合に用いることができる。そうでなければ、標準的な時間フィルタリングを用いることができる。
本明細書において、「フレーム」という用語は、フィルタリング後のものを含む画像単位を説明するために用いられるが、この用語は、画像、フィールド、ピクチャ、または画像・フレーム等のサブユニットまたは領域等の他の同様の専門用語にも当てはまる。画素および画素のブロックまたはグループという用語は必要に応じて置き換え可能に用いられる場合がある。
添付図面を参照して本発明の1実施形態を説明する。
本発明は、上述の従来技術のシステムと同様のシステムを用い、後述の変更を施して実施することができる。
したがって、本実施形態による符号化システムの基本的な構成要素は図1に示す通りであり、従来技術に関して上述したように動作する。ただし、MCTFモジュールは未連結画素または未連結画素ブロックの処理に関して変更される。
上記のように、動き推定は、4×4の画素ブロックサイズまで行われ、ブロック内の各画素には同一の動きベクトルが割り当てられる。このような4×4の画素ブロックを図4に示す。図4中、c(m,n)は検討中のブロックの画素を表す。近傍画素は、4×4ブロックの一番上の行の上の行の画素がt(p,q)で、4×4ブロックの左の列の左側の列の画素がl(r,s)で表される。
動きベクトルを求めた後、従来技術と同様に動きベクトルおよび関連するDFDを処理して、どの画素を未連結(上で定義)として処理すべきかを判定する。
ブロック内の任意の未連結画素について、当該画素をさらなる処理のために、同一フレーム内の隣接画素を用いて近似(または予測)する(以下でフレーム内予測として説明する)。これはいくつかの方法で実施することができる。
この例では3種類のフレーム内モード、すなわち垂直方向フレーム内予測モード、水平方向フレーム内予測モードおよび水平方向−垂直方向平均フレーム内予測モードがある。
垂直方向フレーム内予測モード:
・t(0,−1)によりc(0,0)、c(0,1)、c(0,2)およびc(0,3)を予測する
・t(1,−1)によりc(1,0)、c(1,1)、c(1,2)およびc(1,3)を予測する
・t(2,−1)によりc(2,0)、c(2,1)、c(2,2)およびc(2,3)を予測する
・t(3,−1)によりc(3,0)、c(3,1)、c(3,2)およびc(3,3)を予測する
水平方向フレーム内予測モード:
・l(−1,0)によりc(0,0)、c(1,0)、c(2,0)およびc(3,0)を予測する
・l(−1,1)によりc(0,1)、c(1,1)、c(2,1)およびc(3,1)を予測する
・l(−1,2)によりc(0,2)、c(1,2)、c(2,2)およびc(3,2)を予測する
・l(−1,3)によりc(0,3)、c(1,3)、c(2,3)およびc(3,3)を予測する
水平方向−垂直方向平均フレーム内予測モード:
・(t(0,−1)+l(−1,0))/2によりc(0,0)を予測する
・(t(1,−1)+l(−1,0))/2によりc(1,0)を予測する
・(t(2,−1)+l(−1,0))/2によりc(2,0)を予測する
・(t(3,−1)+l(−1,0))/2によりc(3,0)を予測する
・(t(0,−1)+l(−1,1))/2によりc(0,1)を予測する
・(t(1,−1)+l(−1,1))/2によりc(1,1)を予測する
・(t(2,−1)+l(−1,1))/2によりc(2,1)を予測する
・(t(3,−1)+l(−1,1))/2によりc(3,1)を予測する
・(t(0,−1)+l(−1,2))/2によりc(0,2)を予測する
・(t(1,−1)+l(−1,2))/2によりc(1,2)を予測する
・(t(2,−1)+l(−1,2))/2によりc(2,2)を予測する
・(t(3,−1)+l(−1,2))/2によりc(3,2)を予測する
・(t(0,−1)+l(−1,3))/2によりc(0,3)を予測する
・(t(1,−1)+l(−1,3))/2によりc(1,3)を予測する
・(t(2,−1)+l(−1,3))/2によりc(2,3)を予測する
・(t(3,−1)+l(−1,3))/2によりc(3,3)を予測する
本システムは、どの予測モードが好ましいかについて設定することができる。その場合、用いられている予測モードの予測値が得られない場合(例えば垂直方向フレーム内予測モードにおいて関連するt(p,q)の値が得られない場合)、システムは、代替的な予測モード(例えば水平方向予測モード)を用いるように設定することができる。他の予測モードの予測値が得られない場合、128という予測値を用いる。
フレーム内予測モードを用いる場合、2つの連続フレームB(現)およびA(参照)の対応ブロックのリフティングの実施態様において、動き補償時間フィルタリング(MCTF)をわずかに変更する。高域通過フィルタリングHを未連結画素に次式により適応する。
H(m,n)=(√2/2)×[B(m,n)−B’(m,n)]
ここでB’(m,n)は、上記のようなフレーム内予測を用いた現フレーム内の予測画素である。連結画素の高域通過フィルタリングおよび低域通過フィルタリングはそのままである。
次に現フレームを未連結画素について次式により再構築する。
B(m,n)=√2×H(m,n)+B’(m,n)
ここでB’(m,n)は以前の再構築画素である。残りの再構築の式は変更されない。
このフレーム内予測手法を用いることによって、用いられる予測値が動き推定プロセスを用いる場合よりも予測されるべき画素値に近くなるため、高域通過時間フレームが改善する。最良の結果を得るには、フレーム内予測モードを動き推定プロセスに基づくMC予測と比較して、最も低い平均歪値をもたらすモード(フレーム内予測またはMC予測)を選択する。
より具体的には、全てのフレーム内予測モード(垂直方向、水平方向および水平方向−垂直方向)およびMC予測モード(逆方向および順方向)の平均絶対差(MAD)の値を計算する。MAD値の最も低いモードを最良の予測モードとして選択する。
本実施形態では、全ての成分、すなわち輝度(luma、Y)および色差(chroma、CbおよびCr)に対して同じ3種類のフレーム内予測モードを用い、それに加えて、各モードにより生じる歪レベルに応じて元のMCPモードを用いる。
可変重み付けパラメータを用いることによって、異なるモードを用いた画素/ブロックの比率を変えることができる。例えば、重み付けパラメータを0に設定することは、すべての未連結画素/ブロックが同一フレームからの画素を予測値として用いて予測されることを意味する可能性があり、重み付けパラメータを上げると、動き補償予測を用いて予測される画素/ブロックの比率が上がる。
上記のフレーム内予想モードは、垂直方向、水平方向および平均予測のみを用いる。しかしながら、様々な他のフレーム内予測を用いることもできる。例えば、MPEG−4 AVCコーデックに規定された全てのモードを用いることができる。それらは、それぞれ垂直方向(モード0)、水平方向(モード1)、DC(モード2)、対角線左下(モード3)、対角線右下(モード4)、垂直方向右(モード5)、水平方向下(モード6)、垂直方向左(モード7)および水平方向上(モード8)予測モードと呼ばれる9種類のフレーム内予測モードである。また、異なるブロックサイズおよび異なる色成分に適用することができる4種類の異なるフレーム内予測モードもある。
図5に示す完全な予測モードの方向セットを以下に示す。
・モード0:Vertical_Up(垂直方向上)
・モード1:Vertical_Up_Right(垂直方向右上)
・モード2:Diagonal_Up_Right(対角線右上)
・モード3:Horizontal_Up_Right(水平方向右上)
・モード4:Horizontal_Right(水平方向右)
・モード5:Horizontal_Down_Right(水平方向右下)
・モード6:Diagonal_Down_Right(対角線右下)
・モード7:Vertical_Down_Right(垂直方向右下)
・モード8:Vertical_Down(垂直方向下)
・モード9:Vertical_Down_Left(垂直方向左下)
・モード10:Diagonal_Down_Left(対角線左下)
・モード11:Horizontal_Down_Left(水平方向左下)
・モード12:Horizontal_Left(水平方向左)
・モード13:Horizotal_Up_Left(水平方向左上)
・モード14:Diagonal_Up_Left(対角線左上)
・モード15:Vertical_Up_Left(垂直方向左上)
・モード16:DC
動き推定では、ブロックサイズの選択はレート歪最適化に基づく。フレーム内予測プロセスは現在、動き推定の後に行われているため、レート歪最適化されていない。フレーム内予測モードの選択は、レート歪最適化に組み込むこともできる。
低域通過フィルタリングされたフレームに対して同様のフレーム内予測プロセスを導入することもできる。
他のタイプの3−D分解および変換を用いてもよい。例えば、本発明は、空間フィルタリングを先に行った後で時間フィルタリングを行う分解スキームに適用することもできる。
本発明は、例えばコンピュータベースのシステムにおいて、あるいは適切なハードウェアおよび/またはソフトウェアを用いて実施することができる。図1には符号化器を示しており、対応する復号化器は、逆の復号化動作を行うための対応する構成要素を有する。
符号化システムのブロック図である。 GOPの時間分解を示す図である。 フレームペアならびに連結画素および未連結画素の図である。 フレーム内の画素配列の図である。 予測画素の選択方向を示す図である。
符号の説明
A,B フレーム、a2,b8 未連結の画素、a5 多重連結の画素、a1,a3,a4,a6〜a9,b1〜b7,b9 連結された画素、c(0,0)〜c(3,3) 検討中の画素、t(0,−1)〜t(3,−1),l(−1,0)〜l(−1,3) 近傍画素。

Claims (15)

  1. 時間フィルタリングを伴う3−Dサブバンド分解を用いてフレームシーケンスを符号化する方法であって、
    少なくとも1つの画素について、同一フレーム内の1つまたは複数の画素値を用いて前記画素の値を近似することを特徴とする、フレームシーケンスを符号化する方法。
  2. 時空間フィルタリングを伴う3次元(3−D)サブバンド分解を用いる請求項1に記載のフレームシーケンスを符号化する方法。
  3. 前記画素は、同一フレーム内の1つまたは複数の近傍画素、またはそれらの組み合わせを用いて近似される請求項1または請求項2に記載のフレームシーケンスを符号化する方法。
  4. 垂直方向または水平方向の近傍画素を近似値として用いる請求項3に記載のフレームシーケンスを符号化する方法。
  5. 同一フレーム内の複数の画素のいずれかを前記画素の近似値として考える請求項1〜4のいずれか一項に記載のフレームシーケンスを符号化する方法。
  6. 前記画素の値と前記近似値との差を比較することと、
    最良の近似値を選択することと
    を含む請求項3〜5のいずれか一項に記載のフレームシーケンスを符号化する方法。
  7. 動き補償および他のフレーム内の値を用いて前記画素の値を近似することと、
    他のフレームを用いた近似と同一フレームを用いた近似との結果を比較することと、
    最良の近似値を選択することと
    をさらに含む請求項1〜6のいずれか一項に記載のフレームシーケンスを符号化する方法。
  8. 前記近似は未連結画素に対して用いられる、請求項1〜7のいずれか一項に記載のフレームシーケンスを符号化する方法。
  9. 前記近似された画素値は、前記サブバンド分解における高域通過または低域通過フレーム内の前記画素を表すために用いられる請求項1〜8のいずれか一項に記載のフレームシーケンスを符号化する方法。
  10. 前記サブバンド分解における高域通過または低域通過フレーム内の前記画素を表すことは、前記近似された画素値、または前記近似された画素値および前記画素値を用いた変換式を伴う請求項9に記載のフレームシーケンスを符号化する方法。
  11. 時空間フィルタリングを伴う3−Dサブバンド分解を用いてフレームシーケンスを符号化する方法であって、
    前記3−Dサブバンド分解は、少なくとも1つの画素について、同一フレーム内の1つまたは複数の画素値を用いて前記画素の値を近似することを伴う、フレームシーケンスを符号化する方法。
  12. 請求項1〜11のいずれか一項に記載の方法を用いて符号化されたフレームシーケンスを復号する方法であって、
    同一フレーム内の少なくとも1つの他の画素の値を用いてフレームの画素値を再構築することを含む、フレームシーケンスを復号する方法。
  13. 請求項1〜12のいずれか一項に記載の方法を実施するようになっている符号化および/または復号装置。
  14. 請求項1〜12のいずれか一項に記載の方法を実行するコンピュータプログラム。
  15. 請求項14に記載のコンピュータプログラムを格納するコンピュータ読み取り可能な記憶媒体。
JP2004262587A 2003-09-09 2004-09-09 フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体 Expired - Fee Related JP4794147B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP03255624.3 2003-09-09
EP03255624A EP1515561B1 (en) 2003-09-09 2003-09-09 Method and apparatus for 3-D sub-band video coding

Publications (2)

Publication Number Publication Date
JP2005086834A true JP2005086834A (ja) 2005-03-31
JP4794147B2 JP4794147B2 (ja) 2011-10-19

Family

ID=34130348

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004262587A Expired - Fee Related JP4794147B2 (ja) 2003-09-09 2004-09-09 フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体

Country Status (5)

Country Link
US (1) US7881374B2 (ja)
EP (1) EP1515561B1 (ja)
JP (1) JP4794147B2 (ja)
CN (1) CN100411441C (ja)
DE (1) DE60317670T2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007010690A1 (ja) * 2005-07-22 2009-01-29 三菱電機株式会社 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法、画像符号化プログラム、画像復号プログラム、ならびに画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体
JP2012089987A (ja) * 2010-10-18 2012-05-10 Mitsubishi Electric Corp 動画像符号化装置
JP2016529747A (ja) * 2013-05-23 2016-09-23 トムソン ライセンシングThomson Licensing ビデオシーケンスをトーンマッピングする方法

Families Citing this family (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI243615B (en) * 2004-10-11 2005-11-11 Ind Tech Res Inst System for enhancing compression ratio of scalable video coding and method thereof
EP1808024B1 (en) * 2004-11-04 2013-04-17 Thomson Licensing Fast intra mode prediction for a video encoder
KR100703745B1 (ko) * 2005-01-21 2007-04-05 삼성전자주식회사 비동기 프레임을 효율적으로 예측하는 비디오 코딩 방법 및장치
KR100873636B1 (ko) * 2005-11-14 2008-12-12 삼성전자주식회사 단일 부호화 모드를 이용하는 영상 부호화/복호화 방법 및장치
US9204149B2 (en) * 2006-11-21 2015-12-01 Vixs Systems, Inc. Motion refinement engine with shared memory for use in video encoding and methods for use therewith
US9031129B2 (en) * 2007-06-15 2015-05-12 Microsoft Technology Licensing, Llc Joint spatio-temporal prediction for video coding
US8422803B2 (en) * 2007-06-28 2013-04-16 Mitsubishi Electric Corporation Image encoding device, image decoding device, image encoding method and image decoding method
US20090168871A1 (en) * 2007-12-31 2009-07-02 Ning Lu Video motion estimation
EP2255534B1 (en) * 2008-03-20 2017-12-20 Samsung Electronics Co., Ltd. Apparatus and method for encoding using bandwidth extension in portable terminal
JP5344238B2 (ja) * 2009-07-31 2013-11-20 ソニー株式会社 画像符号化装置および方法、記録媒体、並びにプログラム
US20120236936A1 (en) * 2011-03-14 2012-09-20 Segall Christopher A Video coding based on edge determination
US9398300B2 (en) 2011-10-07 2016-07-19 Texas Instruments Incorporated Method, system and apparatus for intra-prediction in video signal processing using combinable blocks
WO2014038330A1 (ja) * 2012-09-06 2014-03-13 ソニー株式会社 画像処理装置及び画像処理方法
CN103108187B (zh) * 2013-02-25 2016-09-28 清华大学 一种三维视频的编码方法、解码方法、编码器和解码器
CN104202594B (zh) * 2014-07-25 2016-04-13 宁波大学 一种基于三维小波变换的视频质量评价方法
US11800056B2 (en) 2021-02-11 2023-10-24 Logitech Europe S.A. Smart webcam system
US11800048B2 (en) 2021-02-24 2023-10-24 Logitech Europe S.A. Image generating system with background replacement or modification capabilities

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100461210B1 (ko) * 1995-10-25 2005-06-17 코닌클리케 필립스 일렉트로닉스 엔.브이. 세그먼트된화상코딩방법과시스템및대응하는디코딩방법과시스템,및코딩된신호를포함하는기록/판독가능매체와코딩된신호를저장하는컴퓨터판독가능저장매체
US5841473A (en) * 1996-07-26 1998-11-24 Software For Image Compression, N.V. Image sequence compression and decompression
EP1114555A1 (en) 1999-07-20 2001-07-11 Koninklijke Philips Electronics N.V. Encoding method for the compression of a video sequence
WO2001078402A1 (en) * 2000-04-11 2001-10-18 Koninklijke Philips Electronics N.V. Video encoding and decoding method
JP2004502358A (ja) 2000-06-30 2004-01-22 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ビデオ系列の圧縮のための符号化方法
WO2002009438A2 (en) * 2000-07-25 2002-01-31 Koninklijke Philips Electronics N.V. Video encoding method using a wavelet decomposition
US7020335B1 (en) * 2000-11-21 2006-03-28 General Dynamics Decision Systems, Inc. Methods and apparatus for object recognition and compression
EP1380174A1 (en) * 2001-04-10 2004-01-14 Koninklijke Philips Electronics N.V. Method of encoding a sequence of frames
US7023923B2 (en) * 2002-04-29 2006-04-04 Koninklijke Philips Electronics N.V. Motion compensated temporal filtering based on multiple reference frames for wavelet based coding
US7042946B2 (en) * 2002-04-29 2006-05-09 Koninklijke Philips Electronics N.V. Wavelet based coding using motion compensated filtering based on both single and multiple reference frames
US7653133B2 (en) * 2003-06-10 2010-01-26 Rensselaer Polytechnic Institute (Rpi) Overlapped block motion compression for variable size blocks in the context of MCTF scalable video coders

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2007010690A1 (ja) * 2005-07-22 2009-01-29 三菱電機株式会社 画像符号化装置、画像復号装置、および画像符号化方法、画像復号方法、画像符号化プログラム、画像復号プログラム、ならびに画像符号化プログラムを記録したコンピュータ読み取り可能な記録媒体、画像復号プログラムを記録したコンピュータ読み取り可能な記録媒体
JP4542107B2 (ja) * 2005-07-22 2010-09-08 三菱電機株式会社 画像復号装置及び画像復号方法
JP2012089987A (ja) * 2010-10-18 2012-05-10 Mitsubishi Electric Corp 動画像符号化装置
JP2016529747A (ja) * 2013-05-23 2016-09-23 トムソン ライセンシングThomson Licensing ビデオシーケンスをトーンマッピングする方法

Also Published As

Publication number Publication date
US20050053132A1 (en) 2005-03-10
EP1515561A1 (en) 2005-03-16
EP1515561B1 (en) 2007-11-21
JP4794147B2 (ja) 2011-10-19
CN100411441C (zh) 2008-08-13
CN1595986A (zh) 2005-03-16
DE60317670D1 (de) 2008-01-03
DE60317670T2 (de) 2008-10-30
US7881374B2 (en) 2011-02-01

Similar Documents

Publication Publication Date Title
JP4794147B2 (ja) フレームシーケンスを符号化する方法、フレームシーケンスを復号する方法、その方法を実施する装置、その方法を実行するコンピュータプログラム、およびそのコンピュータプログラムを格納する記憶媒体
JP3149418B2 (ja) 画像予測復号化方法及び装置
JP5133135B2 (ja) インターカラー補償を利用した映像の符号化方法及び装置、復号化方法及び装置
US20150010243A1 (en) Method for encoding/decoding high-resolution image and device for performing same
US20050276323A1 (en) Real-time video coding/decoding
JP7343668B2 (ja) Vvcにおける色変換のための方法及び機器
US20060093041A1 (en) Intra-frame prediction for high-pass temporal-filtered frames in wavelet video coding
WO2011013253A1 (ja) 幾何変換動き補償予測を用いる予測信号生成装置、動画像符号化装置及び動画像復号化装置
WO2006064710A1 (en) Method and system for decomposing multiview videos
JP2007251758A (ja) 動画像符号装置及び方法
JP2008522537A (ja) 多階層基盤のビデオエンコーディング方法、デコーディング方法及び前記方法を利用した装置
JPWO2010001999A1 (ja) 動画像符号化/復号化方法及び装置
CN1695381A (zh) 在数字视频信号的后处理中使用编码信息和局部空间特征的清晰度增强
JP2006054857A (ja) 3d分解を用いてフレームシーケンスを符号化および復号する方法、使用方法、装置、およびコンピュータプログラム
US9271005B2 (en) Multi-pass video encoder and methods for use therewith
KR20180019510A (ko) 비디오 코딩시 오차 변환 및 역 변환 시스템들 및 방법들
KR20110087871A (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
JP3343554B1 (ja) 画像予測復号化方法及び画像予測符号化装置
US20060181650A1 (en) Encoding method and device
KR102111437B1 (ko) 인트라 모드를 이용한 쿼터 픽셀 해상도를 갖는 영상 보간 방법 및 장치
JP2002359852A (ja) 画像予測復号化装置及び方法
JP3343553B1 (ja) 画像予測符号化装置及び方法
JP3930259B2 (ja) インターレース信号符号化装置
Ezhilarasan et al. A hybrid transformation technique for advanced video coding
CN113055670A (zh) 一种基于hevc/h.265的视频编码的方法及系统

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101116

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110216

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110705

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110726

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140805

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees