JP4990622B2 - 画像のグループを符号化及び/又は復号化するための方法 - Google Patents

画像のグループを符号化及び/又は復号化するための方法 Download PDF

Info

Publication number
JP4990622B2
JP4990622B2 JP2006530435A JP2006530435A JP4990622B2 JP 4990622 B2 JP4990622 B2 JP 4990622B2 JP 2006530435 A JP2006530435 A JP 2006530435A JP 2006530435 A JP2006530435 A JP 2006530435A JP 4990622 B2 JP4990622 B2 JP 4990622B2
Authority
JP
Japan
Prior art keywords
image
images
sequence
motion
reference image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006530435A
Other languages
English (en)
Other versions
JP2007503782A (ja
Inventor
フランソワ エドゥワール
ソロー ドミニク
ボワソン ギョーム
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Thomson Licensing SAS
Original Assignee
Thomson Licensing SAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing SAS filed Critical Thomson Licensing SAS
Publication of JP2007503782A publication Critical patent/JP2007503782A/ja
Application granted granted Critical
Publication of JP4990622B2 publication Critical patent/JP4990622B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/177Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a group of pictures [GOP]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/62Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding by frequency transforming in three dimensions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Testing, Inspecting, Measuring Of Stereoscopic Televisions And Televisions (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

本発明は、画像のグループを符号化及び/又は復号化する方法に関する。
本発明は3Dウェーブレット分解に基づくビデオ圧縮のコンテキストにおいて適用される。
従来技術においては、すでに3Dウェーブレット画像分解の技術の利用が提案されており、この3Dウェーブレット画像分解においては画像のグループ又はGOPが2次元又は2D画像にウェーブレット分解を適用するプロセスに従って分解される。これに基づいて、第3の次元の役割を果たす時間次元に沿ったデータストリームの圧縮を実施する。
従来技術では、時間的ウェーブレット分解の間にきわめて扱いにくいポイントが発生する。時間的な分解が実施される場合、GOP画像シーケンスに動きベクトルによって結合されるピクセルにはタグが付けられた。それゆえ、動きベクトルが通過しないピクセルは、時間次元に沿った圧縮処理を実施する時には失われてしまう。
従って、この問題を解決し、処理の間の情報の損失を回避するためには、これらのピクセルに特別な処理を適用する必要があるのだが、これによりウェーブレット処理の効率が低下してしまう。
通常のビデオコーディングスキームでは、動きはブロック、例えば16ピクセルの幅で16ピクセルの高さのブロックにより記述される。この場合、上記の問題は、ブロックの境界にシフトされてしまう。
この問題を解決するために、画像シーケンスの2つの実行方向、すなわちGOP画像シーケンスの自然な(natural)方向及びその正反対の方向におけるピクセルの軌道も考慮された。しかし、この場合、従来技術を基準にすると動き情報の量が倍になってしまう。
従来技術のこれらの欠点に対する対策を提出するために、本発明は、各シーケンス毎にコンフィギュレーションデータを選択し、各GOP画像シーケンス内の接続されないピクセル(unconnected pixels)の個数を低減することを可能にする最適化規準を選択する。
この結果、接続されないピクセルの個数が3Dウェーブレット分解に従って比較的多くの処理を必要とすることなしに大いに低減される。
特に、本発明は、3Dウェーブレット処理に基づく画像シーケンスの符号化及び/又は復号化の方法に関する。本発明の方法は符号化フェーズを含み、この符号化フェーズは、
所定の最適化規準に基づいて連続画像のシーケンスに対して参照画像のような、3Dウェーブレット符号化を構成するための少なくとも1つの情報アイテムを決定するステップと、次いで、
画像のシーケンスに対して参照画像のデータを含むコンフィギュレーション情報ユニットを生成するためのステップと、最後に、
最後にコンフィギュレーション情報に基づいて3Dウェーブレット符号化を実行するためのステップとを有し、
このようにして画像シーケンスの画像に対するコンフィギュレーション情報ユニット及び/又は3Dウェーブレット符号化データの各画像シーケンスに対するユニオン(union)を含む符号化されたデータのストリームを発生する。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するためのステップは、参照画像として少なくとも1つのテスト画像におけるウェーブレット分解のステップ、次いで動き推定のステップ、次いで動き推定ステップの間に接続されないピクセルの数が最小であるような画像シーケンスの画像を参照画像として決定するステップを含む。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するためのステップは、少なくとも1つのテスト画像における動きの振幅を決定するステップ、次いで画像における動きの振幅が最小であるような画像シーケンスの画像を参照画像として決定するステップを含む。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するためのステップは、高周波成分を測定することによって少なくとも1つのテスト画像におけるテクスチャ情報アイテムを決定するステップ、次いで、テクスチャ情報アイテムがもっともリッチであるような画像シーケンスの画像を参照画像として決定するステップを含む。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するステップは、画像シーケンスにおける画像の個数の決定も含む。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するステップは、画像シーケンスに対する時間的分解の少なくとも1つの方向の決定も含む。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するステップは、
第1のステップにおいて所定のサイズの画像シーケンスGOPを構成し、
第2のステップにおいて各画像シーケンス毎に接続されないピクセルの数を最小化する選択に従って画像シーケンスの最初の画像を参照画像として及びフォワード方向における時間的分解の方向をセレクトするか又は画像シーケンスの最後の画像を参照画像として及びバックワード方向における時間的分解の方向をセレクトする
ことから成る。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するステップは、
第1のステップにおいて所定のサイズのGOP画像シーケンスを構成し、
第2のステップにおいて参照画像の選択を実行する
ことから成り、
時間的分解の方向は、セレクトされた参照画像に続く画像シーケンスの画像に対してはフォワード方向に決定され、セレクタされた参照画像に先行する画像シーケンスの画像に対してはバックワード方向に決定される。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するステップは、
フォワード方向において画像間で、動きを推定するステップ、フォワード動き推定における動きドットの軌道を構成するステップ及び軌道を構成するステップの間に接続されないピクセルの個数を計算するステップを含み、
バックワード方向において画像間で、バックワード方向において画像間で動きを推定するステップ、バックワード動き推定における動きドットの軌道を構成するステップ及び軌道を構成するステップの間に接続されないピクセルの個数を計算するステップを含み、
接続されないピクセルの最小個数に基づいて最良の参照画像を選択するステップを含む。
本発明によれば、少なくとも1つのコンフィギュレーション情報アイテムを決定するステップは、
フォワード方向において画像間で動きを推定するステップ及び同時にバックワード方向において画像間で動きを推定するステップを含み、
次いで、ループが適応されるGOPシーケンスの各画像毎に実施され、このループ内では連続的に軌道を構成するステップが実行され、次いで接続されないピクセルの個数を計算するステップが実行され、
次いで、適応されるGOP画像シーケンスにおける最良の参照画像をセレクトするステップが接続されないポイントの最小個数に基づいて実施される。
本発明によれば、本発明の方法は復号化フェーズを含み、この復号化フェーズは、
バイナリデータの所与のストリームにおいて実施された3Dウェーブレット符号化の特性を決定するコンフィギュレーション情報ユニットを復号化し、
3Dウェーブレット復号化処理回路の更新を実施し、
最後に、画像シーケンスを表すバイナリデータのストリームの復号化を実施し、この結果、バイナリデータの所与のストリームに含まれる少なくとも1つの画像のシーケンスを出力側にて発生すること
から成る。
本発明によれば、本発明の方法は3Dウェーブレットベースのビデオコンプレッサ/デコンプレッサスキームに統合されている。
本発明によれば、本発明の方法はMPEGTM符号化/復号化スキームに統合されている。
GOPにおける動きの計算を実施するための基礎となる参照画像及び時間的分解の方向の選択は、この動きにより接続されるピクセルの個数の関数として実行され、この動きの情報は動きベクトルフィールドテクスチャ又は動きデータと結合されうる。2D+Tウェーブレット分解の効率は時間的に接続されるピクセルの個数によって改善される。
本発明の他の特徴及び利点は記述及び添付図面によってより良く明らかとなる。図面は、
図1〜5は従来技術の解決策を表す図であり、
図6〜9は本発明の方法の様々なステップを表し、
図10及び11は本発明の方法をインプリメントするための装置の特定の実施例を表す。
図1に表されているのは、従来技術による3Dウェーブレット圧縮スキームの実施形態である。注意すべきは、この3Dウェーブレット圧縮スキームは本発明の方法が実行された後も利用されるかもしれないことである。また、さらに注意すべきは、方法に関して記述されることは画像シーケンスを処理するためのコンピュータにおける処理ブロックの形式でインプリメントされうることである。
ステップ1の間に、N個の連続画像を含む画像のシーケンスGOPの捕捉又は合成が実行される。GOPシーケンスは次いでウェーブレット分解ステップ2に伝送され、並行して画像間の動きを推定するステップ3にも伝送される。
ウェーブレット分解ステップは時間領域における解析のステップ2a及び空間領域における解析のステップ2b(パターン繰り返し周波数等々)を有する。
実際には、従来技術では、動き推定ステップ3は、GOP画像シーケンス内のベース画像を選択することにより開始され、このベース画像はシーケンスの最後の画像である。画像間の差、つまり画像_2と画像_1との間の差、次いで画像_3と画像_2との間の差、等々によって動きの推定が行われる。この動き推定が実行された場合、動き推定情報アイテムが動き推定情報アイテム8によってウェーブレット分解のための時間領域における解析のステップ2aに伝送され、これにより動きの方向における1次元ウェーブレット分解を実行する。
このウェーブレット分解の間に、異なる時間周波数に従って変換された画像のシーケンスが発生される。時間周波数に変換された画像のシーケンスは次いで2Dウェーブレット変換による空間的分解のステップ2bの間に処理される。
ステップ3の動き推定ステップの終了時に、GOP画像シーケンスにおける動きベクトルを表す動き係数が、GOP画像シーケンスの動きを表すベクトルフィールドを符号化するステップに伝送される。
空間的解析のステップ2bの終了時に、画像シーケンスの各画像における空間周波数を表す係数がエントロピー符号化回路の入力側に伝送される。
ステップ4で実施されるエントロピー符号化は2つのフェーズを含む。すなわち、事前モデリング及び本来の符号化である。このモデリングによって、処理すべきデータフローにおける各シンボルへの確率の割り当てが可能となる。符号化は各シンボルにバイナリ語を割り当てる。このバイナリ語の長さは関連する確率に依存する。このために、ハフマン符号又は算術符号のようなコーディングスキームが利用される。
エントロピー符号化4から送出される符号化係数はデータストリームシェーピング処理回路(data stream shaping processing circuit)6の第1の入力側に伝送され、このデータストリームシシェーピング処理回路6の第2の入力側はステップ3から送出される動きベクトルフィールドの成分を受信する。こうして、これらは全体としてシリアル化された3Dウェーブレット係数データストリームを構成し、こうして、バイナリデータトレイン7を発生する。このバイナリデータトレイン7には暗号化、格納又は伝送処理のようななんらかの適切なその後の処理が適用される。
図2に表されているのは、4つの画像のGOP画像シーケンスの場合の1次元変換技術を示す線図である。時間フィルタリングはベース画像の各ポイントの軌道に沿って実施され、このベース画像は動き推定ステップ3の間に選択される。画像_1、画像_2,...として図2に示された各画像はそのピクセルのシリアル化された形式で表されており、このシリアル化された形式は1次元ウェーブレット変換のための従来のスキームに相応している。図2ではそれゆえ考慮される軌道はそれぞれタグが付けられた位置、画像_1のx1、画像_2のx2等々を通過する。矢印F1、F2及びF3は連続的なインターピクチャ変位を表し、これによってGOP画像シーケンス全体に対して考慮される軌道に相応してウェーブレット係数を識別することが可能になる。
図3に表されているのは、図1のステップ2において言及された1次元ウェーブレット分解のステップである。この例では、長さ2の時間フィルタリングによる長さ4のGOPの2レベル分解を考察する。このような分解が係数のシーケンス[x1,x2,x3,x4]に適用されるならば、ローパスフィルタリング及び2によるサブサンプリングのステップ10を最初に適用し、これにより一対の低周波数係数[L1,L2]を発生する。同時に、ハイパスフィルタリング及び2によるサブサンプリングのステップ11を適用し、これにより一対の高周波数係数[H1,H2]を発生する。
次いで、この一対の低周波数係数[L1,L2]に対して、再びローパスフィルタリング及び2によるサブサンプリングのステップ12を適用し、これにより最も低い時間周波数成分を表す係数[LL]を発生し、同時にハイパスフィルタリング及び2によるサブサンプリングのステップ13を適用し、これにより中間時間周波数成分を表す係数[LH]を発生する。4つの時間周波数ウェーブレット変換係数[LL,LH,H1,H2]のバッチがこうして得られる。さらに、3Dウェーブレット画像圧縮のための最近のスキームでは、画像2と画像3との間のフィールドF2が推定されず、フィルタリング12及び13が実際にはL1とL2との間の推定されたフィールドによって実行される。
この変換は参照画像から生じる軌道毎に実行され、これにより時間周波数に変換された画像を発生することが可能となり、これらの画像は図4に示されたそれぞれ画像_H1、画像H_2、画像_LH、画像_LLである。図2の画像、画像_1、画像_2,...においてタグを付けられた動きドットに相応する4つの係数は、それらの時間周波数トランスポジションの形式においてそれぞれ画像_H1ではH1、画像H_2ではH2、画像_LHではLH、画像_LLではLLである。この結果、考察される軌道は図4の時間周波数線図上に存在する。
本発明の明細書の前書き部分で指示したように、図4の時間的分解の実現において、動きベクトルが通過しないピクセルには図5の時間周波数領域において値が割り当てられない。従来技術では、これらは、接続されないピクセル(unconnected pixels)と呼ばれる。動きベクトルに割り当てられる他の全てのピクセルは正しく処理される。しかし、最後の変換8において、もしシーケンスの線図{画像_1,画像_2,画像_3,画像4}の他のピクセルを接続する動きベクトルが到達していない図5の左側に示された画像_1の線図の「X」によりマーキングされた接続されないピクセルに関する情報が加えられないならば、このようなシーケンスの再構成は、最初のGOP画像シーケンスに対して忠実で正確だとは言えないだろう。
本発明の方法は上記のような従来技術の要素を正確に借用する。データストリームは、カメラにより発生される画像のような「自然な(natural)」画像のような又は合成画像の発生器により発生される画像のような画像のストリームである。本発明の方法は、主に、3Dウェーブレット符号化のためのコンフィギュレーション情報ユニットを従来の符号化器の出力側7において記述されるデータストリームに関連付けることにある。符号化のためのコンフィギュレーション情報はコーディングスキームコスト規準への最適なレスポンスを保証する。
2つのモードがインプリメントされうる:
単一方向モード又は「フォワード/バックワード」モード。このモードでは動き補償の方向がGOP内で一定でなくてはならない。このモードでは、GOPの最初の及び最後の画像だけが参照画像の選択の候補である。
双方向モード。このモードに対しては、GOPの全ての画像が参照画像の選択の候補である。このモードでは、動き補償の両方の方向が参照画像のどちらのサイドにおいても利用される。図6及び7は単一方向モード又は「フォワード/バックワード」モードを示し、図8及び9は双方向モードを示す。
図6には単一方向モードにおける画像の分解が示されており、ただ一つの補償の方向がGOP画像シーケンス毎に許可されている。各画像は垂直のストロークにより時間領域において表示されている。画像ストリームは画像の時間シーケンスにおいて左から右へと3つのGOP画像シーケンスに分割されており、これらの3つのGOP画像シーケンスは連続的に時間においてGOP1、GOP2及びGOP3によって示されている。
本発明によれば、各シーケンスGOP1,GOP2,GOP3,...の画像の個数はGOP毎の接続されないピクセルの個数の上限制約に関連している。
本発明によれば、太いストロークによりマーキングされている参照画像Rの選択は、所与の規準に従って行われる。規準のいくつかの例を以下に記述する。
第1の規準はGOP内の接続されないピクセルの個数の最小化である。この場合、動き補償の2つの方向の各々に対してGOP内の接続されないピクセルの個数を計算する。次いで、このGOP全体に対して接続されないピクセルの個数を最小化する方向及び参照画像を選択する。
第2の規準は動きの振幅の最小化である。この場合、2つの方向の各々に対して、GOP全体における動きの振幅を、例えば各フィールドの各動きベクトルの成分の二乗の和を計算することによって測定する。次いで、動きの最小振幅を示す方向及び参照画像を選択する。
第3の規準は参照画像の情報のリッチネス(richness)である。この場合、最初の及び最後の画像のテクスチャ情報アイテムをそれらのそれぞれのウェーブレット分解の高周波数の振幅によって測定し、最もリッチなものを参照画像として選択する。
図6に示された例において、注目すべきことは、画像ストリームの中の画像のシーケンスが次のようなやり方で次のようなテーブルにおいて定められていることである:
シーケンス サイズ 参照画像 方向
GOP1 4画像 最終画像 《バックワード》
GOP2 8画像 最終画像 《バックワード》
GOP3 4画像 第1画像 《フォワード》。
図7に示されているのは、接続されないピクセルの個数の最小化を使用する単一方向モードにおける本発明の方法の実施例である。ここに示されている複数のステップは各々本発明の方法を実施するための回路の形式で同定可能なプロセッサ又は同定可能なプロセッサの部分において実行され、インプリメンテーションデバイスは直接そこから導出される。
ステップ20によって、画像ストリームが捕捉され、画像間のポジティブ方向における動きの推定のステップ21及び同時に画像間のネガティブ方向における動きの推定のステップ22に伝送される。
次いで、フォワード動き推定21に対してはステップ24及びバックワード動き推定22に対してはステップ25の間に動きドットの軌道の作成を実行する。
次いで、ステップ24の軌道の作成に対してはステップ26の間に及びステップ25の軌道の作成に対してはステップ27の間に接続されないピクセルの個数の計算を実行する。
最後に、ステップ29において適応されたGOP画像シーケンスの空間的変換を表すバイナリストリームを発生するためにステップ28において動き補償の最良の方向を選択する。
動き補償の最良の方向の選択は、ステップ26又はステップ27における記録された接続されないピクセルの個数の最小数によってステップ28において行われる。
注目すべきことは、もしポジティブ方向が接続されないピクセルの個数を最小化するものであると検出されるならば、選択される参照画像は適応されるGOP画像シーケンスの最終画像であることである。逆に、もしネガティブ方向が接続されないピクセルの個数を最小化するものであると検出されるならば、選択される参照画像は適応されるGOP画像シーケンスの第1画像である。
本発明は、GOPの全ての画像を参照画像の選択の候補とすることによって拡張されうる。これは双方向モードである。時間的分解の両方の方向が、この場合、参照画像のどちらのサイドにおいても同一のGOP画像シーケンスに対して採用されうる。
図8に示されているのは、3つのGOP画像シーケンスに分割された画像のストリームの一部分であり、図6により説明されたのと同じ符号化を借用している。しかし、各GOPシーケンスは分解S及びS’の1つ又は2つの方向を有する。分解S及びS’の2つの方向が与えられる場合、参照画像はGOPシーケンス内で決定される。
このモードでは、参照画像Rの選択は単一方向モードの場合と同じ規準、つまりGOP全体にわたって接続されないピクセルの個数の最小化、GOP全体における動きの振幅の最小化及び画像の選択に従って行われる。
図9に示されているのは、双方向モードにおける本発明の方法の実施例であり、つまり、GOPの全画像が参照画像の選択の候補であり、接続されないピクセルの個数の最小化の規準を有する場合の実施例である。ここでも指示されたステップは各々本発明の方法を実行するための回路の形式で同定可能なプロセッサ又は同定可能なプロセッサの部分において実行され、インプリメンテーションデバイスは直接そこから導出される。
ステップ30の間に、画像ストリームが捕捉され、画像間のポジティブ方向の動きの推定のステップ31及び同時に画像間のネガティブ方向の動きの推定のステップ32に伝送される。
次いで、ループ33が適応を施されているGOPシーケンスの各画像に対して実施され、このループ内で連続的に軌道を構成するステップ34が実行され、次いで接続されないピクセルの個数を計算するステップ35が実行される。
次いで、適応を施されているGOP画像シーケンスの中で最良の参照画像Rを選定するステップが実施される。図9では、最良の参照画像を選定する規準は接続されないポイントの最小個数の規準である。
本発明の方法は3Dウェーブレットビデオコンプレッサ/デコンプレッサスキームに統合される。このようなアプリケーションにおいて本発明の方法は3つの別個の場所においてインプリメントされ、これらの3つの別個の場所とは、
符号化ステップがインプリメントされている場所、
コンフィギュレーション情報ユニット及び3Dウェーブレット符号化データを有するバイナリデータストリームが伝送信号又は記録されたデータのキャリアの形式において存在している状態の場所、
復号化ステップがインプリメントされている場所
である。
本発明の局面によれば、本発明の方法はMPEGTM符号化/復号化スキームに統合される。このアレンジメントはMPEG−7規格のインプリメンテーションのフレームワーク内でとりわけ重要である。
図10には本発明の方法をインプリメントする3Dウェーブレット符号化装置の実施形態を詳細に示すブロック線図が示されている。
このような装置はビデオデータストリーム106のための入力側端子100を有し、この入力側端子100は画像群解析器回路101の入力側に結合されており、この回路101の第1の出力側端子107は3Dウェーブレット符号化のためのコンフィギュレーション情報ユニットを生成する回路103の入力側端子109’に接続され、さらにこの第1の出力側端子107は本来の3Dウェーブレット符号化器102の入力側端子109に接続されており、この結果、上述の本発明の方法によって適用される3Dウェーブレット処理を定めるコンフィギュレーションデータをそれらに提供する。回路101は最終的に本来の3Dウェーブレット符号化器102における3Dウェーブレット処理を継続するための第2の出力側端子を有する。
符号化器102の出力側端子110及び生成回路103の出力側端子111はバイナリデータストリームFDBのシェーピングを実行してその出力側105に送出する回路104の相応の入力側に接続されており、この回路104は決定されたプロトコルに従って次のようなシーケンスを含む、すなわち
GOP画像シーケンスに関連する3Dウェーブレット符号化コンフィギュレーション情報ユニットのシーケンス、及び、
相応のGOP画像シーケンスの3Dウェーブレット符号化の結果に相応するバイナリデータストリームのシーケンス
を含む。
こうして構成されるデータストリームは新たな処理回路、記録デバイス又は伝送線路に伝送される。
図11に示されているのは本発明の方法をインプリメントする3Dウェーブレット復号化装置の実施形態の詳細を示すブロック線図である。
このような装置はディスクリミネーティング回路121に接続された入力側端子120を有し、この回路121の出力側端子126及び127はそれぞれ3D復号化コンフィギュレーション情報生成回路122及び3Dウェーブレット復号化回路123に接続されている。図10から生じるバイナリデータのストリームが入力側端子120に伝送されると、データはディスクリミネータ121によって解析され、この結果、ディスクリミネータ121の第1の出力側端子126ではバイナリデータストリームに適用された3Dウェーブレット符号化を特徴付ける情報が現れる。
バイナリデータストリームは次いでディスクリミネータの出力側127に現れ、復号化器123にロードされる。この復号化器123はコンフィギュレーション入力側端子を有し、このコンフィギュレーション入力側端子は、参照画像のデータ、分解の方向及び/又はデータストリーム120において表される画像シーケンスの画像の個数のような各コンフィギュレーション情報ユニットに含まれた情報に基づくコンフィギュレーション情報生成回路122の端子128から送出されるコンフィギュレーション情報を受信する。復号化されたGOP画像のシーケンスは出力側端子124に送出される。
本発明は3Dウェーブレット分解に基づくビデオ圧縮の分野において適用される。それゆえ本発明は3Dウェーブレットベースのビデオコンプレッサ/デコンプレッサスキームに統合されうる。
本発明は従来のハイブリッドコーディングスキーム、とりわけMPEGタイプスキームに適用される。このMPEGタイプスキームではタイプI画像及びタイプP画像が参照画像として使用される。この場合には本発明の方法はMPEG符号化/復号化スキームに統合される。
従来技術の解決策を表す図である。 従来技術の解決策を表す図である。 従来技術の解決策を表す図である。 従来技術の解決策を表す図である。 従来技術の解決策を表す図である。 本発明の方法の様々なステップを表す。 本発明の方法の様々なステップを表す。 本発明の方法の様々なステップを表す。 本発明の方法の様々なステップを表す。 本発明の方法をインプリメントするための装置の特定の実施例を表す。 本発明の方法をインプリメントするための装置の特定の実施例を表す。
符号の説明
1 GOP捕捉又は合成ステップ
2 ウェーブレット分解ステップ
2a 時間領域での解析ステップ
2b 空間領域での解析ステップ
3 動き推定ステップ
4 エントロピー符号化ステップ
5 ベクトルフィールド符号化ステップ
6 データストリームシェーピング処理回路
7 バイナリデータトレイン
8 動き推定情報アイテム
F1、F2、F3 インターピクチャ変位
10 ローパスフィルタリング及び2によるサブサンプリングステップ
11 ハイパスフィルタリング及び2によるサブサンプリングステップ
12 ローパスフィルタリング及び2によるサブサンプリングステップ
13 ハイパスフィルタリング及び2によるサブサンプリングステップ
H1、H2、LH、LL 時間周波数トランスポジション
R 参照画像
20 画像ストリーム捕捉ステップ
21 ポジティブ方向における動き推定ステップ
22 ネガティブ方向における動き推定ステップ
24 フォワード動きドットの軌道構成
25 バックワード動きドット軌道構成
26 接続されないピクセル個数計算
27 接続されないピクセル個数計算
28 動き補償の最小の方向選択
29 GOP空間変換を表すバイナリストリーム生成
30 画像ストリーム捕捉ステップ
31 ポジティブ方向における動き推定ステップ
32 ネガティブ方向における動き推定ステップ
33 ループ
34 軌道構成
35 接続されないピクセル個数計算
36 最良参照画像R選定ステップ
100 入力側端子
101 画像群解析器回路
102 3Dウェーブレット符号化器
103 コンフィギュレーション情報ユニット生成回路
104 データストリームシェーピング回路
105 出力側
106 ビデオデータストリーム
107 第1の出力側端子
108 第2の出力側端子
109 入力側端子
109’ 入力側端子
110 出力側端子
111 出力側端子
120 入力側端子
121 ディスクリミネータ
122 3D復号化コンフィギュレーション情報生成回路
123 3Dウェーブレット復号化回路
124 出力側端子
126 出力側端子
127 出力側端子
128 端子

Claims (11)

  1. 3Dウェーブレット処理に基づいて画像シーケンスを符号化する方法において、
    該方法は符号化フェーズを有し、該符号化フェーズは、符号化されたデータのストリームを発生するように、
    動きベクトルが通過しないピクセルである接続されないピクセルの数を最小化するために、所定の最適化規準に基づいて連続画像のシーケンスに対して参照画像を決定するステップと、
    前記参照画像に基づいて3Dウェーブレット符号化を実行するステップと
    を有することを特徴とする方法。
  2. 前記参照画像を決定するステップは、参照画像として少なくとも1つの画像におけるウェーブレット分解のステップ、次いで動き推定のステップ、次いで動き推定ステップを実行する間に前記接続されないピクセルの数が最小である画像シーケンスの画像を参照画像として決定するステップを含むことを特徴とする、請求項1記載の方法。
  3. 前記参照画像を決定するステップは、少なくとも1つの画像における動きの振幅を決定するステップ、次いで画像における動きの振幅が最小である画像シーケンスの画像を参照画像として決定するステップを含むことを特徴とする、請求項1記載の方法。
  4. 前記参照画像を決定するステップは、高周波成分を測定することによって少なくとも1つの画像における少なくとも1つのテクスチャ情報アイテムを決定するステップ、次いで、テクスチャ情報アイテムがもっともリッチであるような画像シーケンスの画像を参照画像として決定するステップを含むことを特徴とする、請求項1記載の方法。
  5. 前記参照画像を決定するステップは、少なくとも1つの動き補償の方向の決定も含むことを特徴とする、請求項1記載の方法。
  6. 前記参照画像を決定するステップは、
    第1のステップにおいて、所定のサイズの画像シーケンスGOPを構成し、
    第2のステップにおいて、各画像シーケンス毎に接続されないピクセルの数を最小化する選択に従って、画像シーケンスの最初の画像を参照画像として及びフォワード動き補償の向を選択するか、又は、画像シーケンスの最後の画像を参照画像として及びバックワード動き補償の向を選択する
    ことから成ることを特徴とする、請求項1記載の方法。
  7. 前記参照画像を決定するステップは、
    第1のステップにおいて、所定のサイズのGOP画像シーケンスを構成し、
    第2のステップにおいて、参照画像の選択を実行する
    ことから成り、
    さらに、動き補償の方向は、選択された参照画像に後続する画像シーケンスの画像に対してはフォワード方向であり選択された参照画像に先行する画像シーケンスの画像に対してはバックワード方向であることを特徴とする、請求項1記載の方法。
  8. 前記参照画像を決定するステップは、
    フォワード方向において画像間で、動きを推定するステップ、フォワード動き推定における動きドットの軌道を構成するステップ及び軌道を構成するステップを実行する間に前記接続されないピクセルの個数を計算するステップを含み、
    バックワード方向において画像間で、バックワード方向において画像間で動きを推定するステップ、バックワード動き推定における動きドットの軌道を構成するステップ及び軌道を構成するステップを実行する間に前記接続されないピクセルの個数を計算するステップを含み、
    前記接続されないピクセルの最小個数に基づいて最良の参照画像を選択するステップを含むことを特徴とする、請求項記載の方法。
  9. 前記参照画像を決定するステップは、
    フォワード方向において画像間で動きを推定するステップ及び同時にバックワード方向において画像間で動きを推定するステップを含み、
    次いで、ループが適応されるGOPシーケンスの各画像毎に実施され、このループ内では連続的に軌道を構成するステップが実行され、次いで接続されないピクセルの個数を計算するステップが実行され、
    次いで、適応されるGOP画像シーケンスにおける最良の参照画像を選択するステップが接続されないポイントの最小個数に基づいて実施されることを特徴とする、請求項1記載の方法。
  10. 3Dウェーブレットベースのビデオコンプレッサスキームに適用れることを特徴とする、請求項1項記載の方法。
  11. MPEGTM符号化スキームに適用れることを特徴とする、請求項1項記載の方法。
JP2006530435A 2003-05-23 2004-05-12 画像のグループを符号化及び/又は復号化するための方法 Expired - Fee Related JP4990622B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
FR0306197A FR2855356A1 (fr) 2003-05-23 2003-05-23 Procede de codage et/ou de decodage de groupe d'images
FR0306197 2003-05-23
PCT/FR2004/050190 WO2004107761A1 (fr) 2003-05-23 2004-05-12 Procede de codage et/ou de decodage de groupes d'images

Publications (2)

Publication Number Publication Date
JP2007503782A JP2007503782A (ja) 2007-02-22
JP4990622B2 true JP4990622B2 (ja) 2012-08-01

Family

ID=33396691

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006530435A Expired - Fee Related JP4990622B2 (ja) 2003-05-23 2004-05-12 画像のグループを符号化及び/又は復号化するための方法

Country Status (9)

Country Link
US (1) US7864863B2 (ja)
EP (1) EP1636996A1 (ja)
JP (1) JP4990622B2 (ja)
KR (1) KR101011894B1 (ja)
CN (1) CN100591127C (ja)
FR (1) FR2855356A1 (ja)
MY (1) MY135286A (ja)
TW (1) TWI339071B (ja)
WO (1) WO2004107761A1 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7983835B2 (en) 2004-11-03 2011-07-19 Lagassey Paul J Modular intelligent transportation system
WO2014205619A1 (en) * 2013-06-24 2014-12-31 Intel Corporation Dynamic compression/decompression (codec) configuration
JP5759652B1 (ja) * 2014-10-28 2015-08-05 楽天株式会社 情報処理装置、情報処理方法、プログラム及び記憶媒体
KR102301232B1 (ko) 2017-05-31 2021-09-10 삼성전자주식회사 다채널 특징맵 영상을 처리하는 방법 및 장치
WO2020046041A1 (en) 2018-08-31 2020-03-05 Samsung Electronics Co., Ltd. Electronic device for high-speed compression processing of feature map of cnn utilizing system and controlling method thereof
US11996934B2 (en) * 2020-06-09 2024-05-28 Qualcomm Incorporated Broadcasting packets using network coding with feedback

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000295622A (ja) * 1999-04-02 2000-10-20 Nippon Telegr & Teleph Corp <Ntt> 動画像符号化方法、動画像符号化装置、動画像復号方法、動画像復号装置及びそれらのプログラムを記憶した記憶媒体
US6549673B1 (en) * 1999-10-28 2003-04-15 Lucent Technologies Inc. Wavelet-based compression of images for storage, transmission and reconstruction using hierarchical subband decomposition
WO2001078402A1 (en) * 2000-04-11 2001-10-18 Koninklijke Philips Electronics N.V. Video encoding and decoding method
US6795504B1 (en) * 2000-06-21 2004-09-21 Microsoft Corporation Memory efficient 3-D wavelet transform for video coding without boundary effects
US20030202599A1 (en) * 2002-04-29 2003-10-30 Koninklijke Philips Electronics N.V. Scalable wavelet based coding using motion compensated temporal filtering based on multiple reference frames
WO2004049723A1 (en) * 2002-11-27 2004-06-10 Koninklijke Philips Electronics N.V. Video encoding method
TWI255146B (en) * 2003-12-04 2006-05-11 Nec Corp Moving picture encoding method and device, and moving picture decoding method and device, and storage medium

Also Published As

Publication number Publication date
CN100591127C (zh) 2010-02-17
TW200509702A (en) 2005-03-01
EP1636996A1 (fr) 2006-03-22
TWI339071B (en) 2011-03-11
CN1784906A (zh) 2006-06-07
KR20060027796A (ko) 2006-03-28
KR101011894B1 (ko) 2011-02-01
US20060233256A1 (en) 2006-10-19
MY135286A (en) 2008-03-31
WO2004107761A1 (fr) 2004-12-09
FR2855356A1 (fr) 2004-11-26
US7864863B2 (en) 2011-01-04
JP2007503782A (ja) 2007-02-22

Similar Documents

Publication Publication Date Title
JP3901287B2 (ja) 映像信号変換装置、映像信号変換方法及び映像提供システム
US20070133687A1 (en) Motion compensation method
JP2004229315A (ja) 直交変換−ドメインブロックマッチングを用いる動き推定
WO2006046551A1 (ja) 画像符号化方法および装置、ならびに画像復号方法および装置
US8204111B2 (en) Method of and device for coding a video image sequence in coefficients of sub-bands of different spatial resolutions
JP2001515679A (ja) 高分解能静止画像を創出するための方法及び装置
JP2007518367A (ja) マッチング追跡を用いたデータ圧縮
WO2002071741A2 (en) A device and method for performing half-pixel accuracy fast search in video coding
KR20050028019A (ko) 하나 및 다수의 기준 프레임을 기반으로 한 움직임 보상필터링을 사용한 웨이블릿 기반 코딩
KR100561587B1 (ko) 3차원 웨이브렛 변환 방법 및 장치
EP1472881B1 (en) Unit for and method of estimating a current motion vector
JPH08140092A (ja) 画像符号化装置
JP4990622B2 (ja) 画像のグループを符号化及び/又は復号化するための方法
WO2006046550A1 (ja) 画像符号化方法および装置、ならびに画像復号方法および装置
JPH0779418A (ja) 画像信号変換装置
TW432880B (en) Optimized video compression from a single process step
JPH09261660A (ja) 輪郭線符号化方法及び輪郭線符号化装置
JP3759538B2 (ja) 画像信号処理方法及び画像信号伝送装置
CN107534765A (zh) 视频编码系统和方法中的运动矢量选择和预测
Kang et al. Generating images in compressed domain using generative adversarial networks
JP2004056461A (ja) 画像信号の処理装置および処理方法、画像表示装置、それに使用される係数データの生成装置および生成方法、並びに各方法を実行するためのプログラムおよびそのプログラムを記録したコンピュータ読み取り可能な媒体
JPH0884335A (ja) 画像信号処理方法及び画像信号伝送装置
JPH1023420A (ja) 動き検出方法および動き検出装置
JP6864557B2 (ja) 符号化装置、復号装置、及びプログラム
JPH1169147A (ja) 直交変換符号化画像の画像サイズ変換方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100212

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20100507

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20100514

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100809

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100907

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20100907

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20100908

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110125

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20110422

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20110502

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110721

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120417

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120502

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150511

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees