JP4382284B2 - サブバンドの符号化/復号 - Google Patents

サブバンドの符号化/復号 Download PDF

Info

Publication number
JP4382284B2
JP4382284B2 JP2000569355A JP2000569355A JP4382284B2 JP 4382284 B2 JP4382284 B2 JP 4382284B2 JP 2000569355 A JP2000569355 A JP 2000569355A JP 2000569355 A JP2000569355 A JP 2000569355A JP 4382284 B2 JP4382284 B2 JP 4382284B2
Authority
JP
Japan
Prior art keywords
luminance
chrominance
information
shape information
applying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2000569355A
Other languages
English (en)
Other versions
JP2003533064A5 (ja
JP2003533064A (ja
Inventor
リー,シァイピン
リー,ハン−ジュ
ソドガー,イラジ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
MediaTek Inc
Original Assignee
MediaTek Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by MediaTek Inc filed Critical MediaTek Inc
Publication of JP2003533064A publication Critical patent/JP2003533064A/ja
Publication of JP2003533064A5 publication Critical patent/JP2003533064A5/ja
Application granted granted Critical
Publication of JP4382284B2 publication Critical patent/JP4382284B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/20Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using video object coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/20Contour coding, e.g. using detection of edges
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/48Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using compressed domain processing techniques other than decoding, e.g. modification of transform coefficients, variable length coding [VLC] data or run-length data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Description

【0001】
本願は、1998年9月8日提出の米国仮特許出願第60/099,379号の利益を請求するとともに、この米国仮出願は参照によって本願に組み込まれている。
本発明は形状又はオブジェクトマスク符号化用の装置と方法に関する。より詳細には、本発明は、輝度成分からクロミナンス(色)成分用形状情報を導出することによりスケーラブルな形状符号化の効率を高める方法に関する。
【0002】
発明の背景
形状又はオブジェクトマスクの符号化(オブジェクト指向の画像及び動画符号化としても知られている)は、広く受け入れられており、現在、例えばMPEG−4(Moving Picture Expert Group)国際規格のような種々のマルチメディアの規格に採用が推進されている。しかしながら、従来のフレーム符号化方法と異なり、各フレーム又はピクチャは、1つ又はそれ以上のフレキシブルなオブジェクト(任意の形状を有するオブジェクト)より成ると考えられ、並進移動,回転,スケーリング,明度及び色の変化等の変化が生じる。形状又はオブジェクトマスクの符号化を用いると、色々な機能性がフレームレベルだけでなくオブジェクトレベルにおいても実現できる。
【0003】
機能性の1つはスケーラビリティ、即ち、画像を種々異なる空間解像度で提供できることである。一般に、形状符号化は、1つの画像フレームを複数のオブジェクト又はビデオオブジェクトプレイン(VOP)に分割することから始まり、例えば、画像中の1人の話者を第1オブジェクトとし背景を第2オブジェクトとして分割する。結果として生じる“形状情報”は“2値マスク”として表現できる。この2値形状情報は、オブジェクトマスクに次の2つの値のみを、即ち、透明又は不透明の情報のみを付与する(ここで透明は対応画素がオブジェクトの外側にあり、不透明は対応画素がオブジェクトの内側にあることを意味する)。マスクは、1つのオブジェクトの形状又は1つのオブジェクトに関係する画素を規定する情報として広く定義できる。より詳細には、形状情報又はオブジェクトマスクは、画像又は動画のオブジェクトの任意形状と、このオブジェクトのテクスチャの符号化を要する領域を示するために用いられる。このオブジェクトマスクを追跡し、テクスチャ情報と共にビットストリームに符号化するので、オブジェクトに基く種々の機能性を提供することが可能である。形状又はオブジェクトマスクの新しい符号化の1例が、ここに援用し、譲受人が権利を共同所有している1999年5月17日に出願した“包括的でスケーラブルな形状符号化方法と装置(Method And Apparatus For Generic Scalable Coding)”の米国特許出願第09/312,797号に開示されている。
【0004】
さらに、サブバンドに基く符号化(例えば、下述するウェーブレットに基く符号化)は、MPEG−4規格により支持されている。ウェーブレットベース符号化スキーム(ウェーブレットに基く符号化スキーム)の利点の1つは、フレキシブルな空間のスケーラビリティである。かように、この符号化規格は、テクスチャ符号化の空間的スケーラビリティと形状符号化の空間的スケーラビリティの両方を支持すべきである。
【0005】
残念ながら、形状適応ウェーブレット変換の特性により、1つの領域内のテクスチャ情報のウェーブレット変換は、その領域の形状情報に基いている。かように、復号器端末でテクスチャ情報を完全に再構成するためには、逆ウェーブレット変換用復号器端末で用いる領域形状は、ウェーブレット変換用符号器端末で用いた領域形状と正確に同一でなければならない。これは、輝度成分及びクロミナンス(色)成分用各空間レイヤについても当てはまる。残念ながら、このために、輝度及びクロミナンスの形状情報は共にビットストリームに符号化することが要求され、そのために符号化効率が低下する。
【0006】
形状符号化の空間的スケーラビリティが復号器端末において要求されないならば、常に輝度用形状情報の全解像度から始めて、符号化器での分割順序と同じ順序による何れの空間レベルにおいてもクロミナンスの正確な形状を導出できることに注目すべきである。しかしながら、形状符号化のスケーラビリティが要求される場合、利用できないか、又は、特定用途において計算的に実用に適さない輝度形状情報の全解像度から出発する必要なく、同じ空間レベルにおける輝度形状からクロミナンス情報の正確な形状を導出できることが望ましい。
従って、当技術において求められているのは、各空間レイヤに対する輝度成分の形状からクロミナンス成分の正確な形状を導出できる包括的で空間的にスケーラブルな形状符号化方法と装置である。
【0007】
発明の要約
本発明において、各空間レイヤに対する輝度成分の形状からクロミナンス成分の正確な形状を導出するための包括的で空間的にスケーラブルな形状符号化装置とその方法の実施形態を開示する。この包括的で空間的にスケーラブルな形状符号化は、一連のサブバンド(例えばウェーブレット)フィルタT1,T2,…TNを使用して輝度成分とクロミナンス成分の両方のテクスチャ情報と形状情報の両方についてNレベルのウェーブレット分割を得る。
より詳細には、一連のサブバンドフィルタT1,T2,…TNを入力画像に適用し、輝度成分のテクスチャ情報と形状情報の両方についてNレベルのサブバンド分割を得る。このサブバンドフィルタ処理は、2つの異なる処理ステップ、即ち、空間フィルタ処理ステップとサブサンプリング処理ステップより成ることに注目すべきである。好適な実施形態において、前記サブバンドフィルタT1の対応サブサンプリング関数(T1)を全解像度の輝度形状情報又はマスクに適用し、全解像度のクロミナンス形状情報を得る。順番に、一連の対応サブバンドフィルタ((T2),…(TN))を全解像度のクロミナンス形状情報に適用し、追加レベルのクロミナンス形状情報を得る。次に、一連の対応サブバンドフィルタT2…TNと複数レベルのクロミナンス形状情報を全解像度のクロミナンステクスチャ情報に適用して、複数レベルのクロミナンステクスチャ情報を得る。
最後に、複数解像度レベルの輝度のテクスチャ情報と形状情報をビットストリームに符号化する。一方、複数解像度レベルのクロミナンスのテクスチャ情報のみをビットストリームに符号化する。即ち、符号化効率は、複数の解像度レベルのクロミナンス形状情報をビットストリームに符号化する必要がないために向上し、同時に好ましいスケーラビリティの特徴も提供できる。
さらに、本発明は、1つのオブジェクト内の1つの輝度画素に対応する欠落クロミナンス成分を補間する新規な方法を開示する。即ち、欠落クロミナンス成分は、クロミナンス平面内の3つの近傍値の平均をとって補間する。
【0008】
好適な実施態様の詳細な説明
オブジェクト指向の画像及び動画の符号化において形状の符号化は重要である。形状情報又はオブジェクトマスクは、画像又は動画オブジェクトの任意形状と、そのオブジェクトの符号化を要するテクスチャ領域を示すために用いられる。
【0009】
図1は、本発明によるオブジェクト指向符号化システム100のブロック図である。1つ又はそれ以上の任意形状のオブジェクトを有する入力画像又はフレーム110を符号化するために符号器120に供給する。符号器120は、入力画像のテクスチャの符号化122と形状の符号化124を実行して入力画像を表わす符号化ビットストリームを生成するように設計されている。ビットストリームは、その後、通信チャネル130により復号器140に送られる。符号器120と相補関係にある復号器140は、テクスチャの復号142と形状の復号144を実行してビットストリームを復号し、1つ又はそれ以上の任意形状のオブジェクトを有する再構成入力画像150を生成する。符号化ビットストリ−ムのスケーラビリティにより、再構成した入力画像150は、入力原画像のスケールバージョンであり得ることに注目すべきである。
【0010】
図2は、本発明による符号化/復号システム200の詳細を示している。この符号化/復号システム200は、符号器210と復号器270を含む。好適な実施形態において、符号器210は、形状符号器211とテクスチャ符号器220を含む。形状符号器211は例えばオブジェクトマスクのような形状情報を生成して符号化するために用いられ、テクスチャ符号器220はオブジェクトマスクにより境界を定められた領域の輝度とクロミナンスの変化を符号化するために用いられる。
【0011】
より詳細には、入力画像信号は、パス205で送られて、両符号器211と220により受信される。この入力画像信号は、輝度信号と2つの色差信号として表現されるディジタル化された入力動画画像(画像列)であり得る。
【0012】
形状符号器211は、入力画像から形状情報を抽出するために作動し、例えば1つ又はそれ以上のオブジェクトを検出し、オブジェクトマスクを生成し、オブジェクトマスクを分割し及び/又はオブジェクトマスクを符号化する。かように、この包括的で空間的にスケーラブルな形状符号化方法を形状符号器211で実行する。入力画像信号はすでに“オブジェクトベース(オブジェクトに基く)”情報を含んでいるので、1つ又はそれ以上の形状処理ステップを省くことができる。例えば、入力画像信号がVOP情報(ビデオオブジェクトプレイン情報
)を含んでいる場合、オブジェクトは既に形状符号化器211用に定義済みなので、セグメンテーション処理を省くことができる。
【0013】
テクスチャ符号化器220は動き推定モジュール230,動き補償モジュール229,変換モジュール(離散余弦変換(DCT)又は離散ウェーブレット変換(DWT))222,量子化(Q)モジュール223,エントロピー符号化モジュール(例えば、可変長符号化器(VLC))224,バッファ225,逆量子化(Q-1)モジュール226,逆変換(DCT-1又はDWT-1)モジュール227,減算器221及び加算器234を含むことができる。テクスチャ符号化器220は一例を示したものであり、本発明はいかなる特定のテクスチャ符号化器にも限定されないことに注意すべきである。
【0014】
作動時、入力画像信号は、動きベクトルを推定するために動き推定モジュール230に送られる。実際は、動き推定モジュール230は、動き推定処理において形状符号化器から受信した形状情報を用いることができる。動きベクトルは動き補償モジュール229に送られる。動き補償モジュールは、予測誤差を形成するために用いる既に復号されたサンプル値を含んでいる過去及び/又は未来の基準フレームとのオフセットを提供するための動きベクトルを用いて予測を行う。
【0015】
動き補償予測(予測画像)をパス236上に生成し、減算器221によりパス205上で入力画像から引き算し、パス231上に誤差信号又は予測残差信号を形成する。次に空間変換モジュール222によって、空間冗長度を除去する目的で変換係数を生成する。
【0016】
生成された変換係数は量子化モジュール223により受信され、そこで量子化される。次に、量子化された係数は、信号接続路235を介して、例えば、可変長符号化(VLC)モジュール224のようなエントロピー符号化モジュールにより受信される。量子化された係数はそこでエントロピー符号化され、伝送又は蓄積のために“先入れ先出し(FIFO)”バッファ225に送られ受信される。
【0017】
さらに、量子化モジュール223からの量子化係数も又、信号接続路233を介して逆量子化モジュール226により受信される。その結果逆量子化係数は逆変換モジュール227に送られ、そこで逆変換されて復号誤差信号が生成される。この誤差信号が、動き補償モジュールからの予測信号に加算器234で加算され、復号基準画像(再構成画像)が生成される。
【0018】
符号化器211及び220からの符号化ビットストリームは次にトランスポートストリームマルチプレクサ240により受信され、そこで多重化されてトランスポートストリームが生成される。このトランスポートストリームは通信チャネル250を介して伝送される。尚、このチャネルはさらに(図示しない)独立したチャネル専用の符号化器と復号器を内蔵することができる。次に、このトランスポートストリームをトランスポートストリームの逆マルチプレクサ260で逆多重化して復号する。ここで、基本ストリームが動画復号器270への入力であり、この復号器の出力がパス290上の復号動画信号である。本発明による符号化方法と装置に関し次に説明するが、これに対応及び相補する復号プロセスは形状復号器274とテクスチャ復号器272の相補セットにより実行されることに注目すべきである。
【0019】
さらに、図2は、例えば、テープドライブ,フロッピードライブ,ハードディスクドライブ又はコンパクトディスクドライブに限定されず、キーボード,マウス,オーディオレコーダ,カメラ,カムコーダ,ビデオモニタ、任意数の画像装置又は蓄積装置(図示しない)のような、種々の入出力装置を有する汎用コンピュータ上でインプリされた本発明の符号化器210と復号器270を示している。即ち、この汎用コンピュータは、(図示しない)中央処理装置(CPU)、(図示しない)メモリ及び以下に説明する方法によって画像、動画及び/又はオーディオ信号を符号化する符号化器210から構成されている。
【0020】
この符号化器210は物理的な装置であり、通信チャネルでCPUと接続されている。これに代わる別の符号化器210は、例えば、ソフトウェアを記憶媒体(例えば、磁気又は光ドライブ又はディスケット)からロードし、コンピュータのメモリ内のCPUにより実行するソフトウェアアプリケーション(又は、特定用途向け集積回路(ASIC)を使用するソフトウェアとハードウェアの組み合わせ)により実現できる。かように、本発明の符号化器自体とその符号化器により実行される方法をコンピュータ可読媒体に蓄積させることができる。
【0021】
同様に、復号器270も通信チャネルでCPUと接続される物理的な装置であり得る。別の方法として、復号器270は、例えば、ソフトウェアを記憶媒体(例えば、磁気又は光ドライブ又はディスケット)からロードし、コンピュータのメモリ内のCPUにより実行するソフトウェアアプリケーション(又は、特定用途向け集積回路(ASIC)を使用するソフトウェアとハードウェアの組み合わせ)により実現できる。かように、本発明の復号器自体とその復号器により実施される方法はコンピュータ可読媒体に蓄積させることができる。
【0022】
特に、本発明は、輝度成分からクロミナンス成分用の形状情報を導出することにより、スケーラブルな形状符号化の効率を高める方法を開示する。本発明は、クロミナンス形状と輝度形状間に“不一致”がある状態について述べる。かような不一致は生成ビットストリームのスケーラビリティに影響する。
【0023】
例えば、クロミナンス成分が輝度成分と同じ空間解像度を有している場合、クロミナンス成分の形状又はオブジェクトマスクは、全ての空間レイヤについて、輝度成分の形状又はオブジェクトマスクと同じであるので、不一致問題は解決される。しかしながら、クロミナンス成分が輝度成分と同じ解像度を持っていない(例えばYUV420,YUV422フォーマットのように、通常クロミナンス成分は輝度成分より低い解像度を有する)場合、不一致が生じる。即ち、テクスチャ情報を分割するために使用するウェーブレットフィルタと輝度形状をクロミナンス形状にサブサンプリングするために使用するフィルタは、クロミナンステクスチャ情報を分割するために用いるフィルタと異なるかもしれないので、より高いクロミナンス空間レイヤから導出したクロミナンス形状(正しいが、形状符号化のスケーラビリティのために利用できない可能性がある形状)と同じ空間レイヤにおける輝度形状から導出したクロミナンス形状間の不一致が発生し得る。
【0024】
MPEGのコンテキストにおいて、現在、形状適応ウェーブレット変換に使用できる2種類の一般的なタイプのウェーブレットフィルタ、即ち、テクスチャ分割用の偶対称フィルタと奇対称フィルタがあり、これに対して、空間レイヤ間の形状分割用には多数の異なるフィルタが使用できる。奇対称フィルタの場合、一次元(1−D)分割は、偶数位置のマスク値を全てサブバンドに、奇数位置のマスク値を全てサブバンドにサブサンプリングすることから始める。奇数位置に孤立画素があれば、低サブバンドと高サブバンドにおける対応位置のマスク値を置換(スワップ)する。これに対し、偶対称フィルタの場合、一次元(1−D)分割は、偶数位置のマスク値を全て低サブバンドに、奇数位置のマスク値を全て高サブバンドにサブサンプリングすることから始める。1つのセグメントが奇数位置から始まれば、低サブバンドと高サブバンドにおける開始位置のマスク値をスワップする。
【0025】
しかしながら、高空間レイヤから低空間レイヤまでのウェーブレット分割フィルタは本質的に非線形サブサンプリングプロセスであるので、輝度形状から導出したクロミナンス形状は、より高いクロミナンス空間レイヤから導出したクロミナンス形状と一致しない。異なる空間レイヤに異なるフィルタの使用を許す新しいシンタックスがMPEG−4のビジュアルテクスチャ符号化に加えられたが、かようなフィルタ選択の拡大は、形状符号化のスケーラビリティが要求される場合、不一致形状のケース数を増大させる。
【0026】
これに対し、本発明は、以下に記述するように、この不一致問題について述べるが、現行のMPEG−4シンタックスに何の変更を加えることなく、オブジェクト指向の符号化において形状スケーラビリティとテクスチャスケーラビリティの両方が可能になる。図3乃至図5を同時に参照しながら本発明につき以下に説明する。
【0027】
図5は本発明による形状又はオブジェクトマスクの符号化方法500を説明するフローチャートである。図3及び図4は、任意形状の画像及び動画を符号化及び復号する際に輝度とクロミナンスの形状とテクスチャの符号化にスケーラビリティを与える本発明のウェーブレット分割構造を示すブロック図である。
【0028】
方法500は、ステップ505より始まりステップ510に進み、一連の異なるか又は同じサブバンド(例えばウェーブレット)フィルタT1,T2,…,TNを入力画像の輝度平面に適用し、輝度成分につきテクスチャ4101〜410N+1と形状4201〜420N+1の両方ともNのレベルのサブバンドに分割する。クレイムの解釈のために、フィルタT1は“第1フィルタ”又はフィルタ関数と呼び、TNは“N番目のフィルタ”又はフィルタ関数と呼ぶ。
【0029】
サブバンドフィルタ処理は、2つの異なる処理ステップ、即ち、空間フィルタ処理とサブサンプリング処理より成ることに留意すべきである。図3及び図4に示すように、本発明において、“( )”括弧なしの“T”はフィルタ処理とサブサンプリング処理の両方を行うサブバンドフィルタ処理を示し、“( )”付きの“(T)”はサブバンドフィルタ“T”の対応サブサンプリングステップのみを示す。
【0030】
ステップ520において、方法500は、全解像度の輝度形状又はオブジェクトマスク4201に対応サブサンプリングフィルタ(T1)を適用し、全解像度のクロミナンス形状又はオブジェクトマスク4301を得る。即ち、クロミナンス平面(UとV)の場合、サブバンドに対応するサブサンプリングフィルタ(奇対称フィルタ又は偶対称フィルタ)又はウェーブレットフィルタT1を用いて輝度形状から全解像度クロミナンス形状を最初に得る。順次、対応するサブサンプリングフィルタ((T2),…,(TN))を全解像度クロミナンス形状情報4301に適用し追加レベルのクロミナンス形状情報4302−430Nを得ることができる。
【0031】
以下の説明において、提案の方法を記述するために、YUV4:2:0のフォーマットのカラー画像を1例として使用する。詳細には、YUV4:2:0フォーマットのカラー画像において、輝度(Y)の2×2画素ブロックは全て、U及びV(クロマ(彩度))の1画素に対応する。しかしながら、他のカラーフォーマットと動画オブジェクトに適応する同様な方法をこの記述から導出できることにも留意すべきである。
【0032】
ステップ530において、方法500は対応するサブバンド又はウェーブレットフィルタT2,…,TNと前記複数レベルのクロミナンスの形状情報を全解像度クロミナンスのテクスチャ情報4401に適用し複数レベルのクロミナンスのテクスチャ情報4402〜440Nを得ることができる。即ち、ウェーブレットフィルタT2,…,TNによる一連のN−1回のウェーブレット変換を上記得られたクロミナンス形状を持つクロミナンスのテクスチャ情報に適用する。即ち、この重要な態様はクロミナンスの形状を同じ空間レイヤの輝度形状から導出できることを保証する。
【0033】
ステップ540において、方法500は複数解像度レベルの輝度のテクスチャ情報と形状情報をビットストリーム450に符号化する。一方、複数解像度レベルのクロミナンスのテクスチャ情報のみをビットストリームに符号化する。即ち、複数解像度レベルのクロミナンスの形状情報をビットストリームに符号化する必要をなくすことにより、所望のスケーラビリティ特徴を維持しながら符号化効率を高めることができる。方法500はステップ550で終了する。
【0034】
上記の符号化方法により、ビットストリーム350内において、復号端末における輝度310N+1とクロミナンス340Nの両方のDCレイヤにおけるテクスチャは同一形状を有する。かように、輝度及びクロミナンスの両方のテクスチャ情報は、DCレイヤ320N+1の輝度形状情報だけで正確に復号できる。より高いレイヤの輝度テクスチャ情報310N〜3101は、より高いレイヤの形状情報320N〜3201を復号するのに応じて正確に復号できる。かように、より高いレイヤのクロミナンスの形状330は、対応サブサンプリングフィルタ((TN-1),…,(T1))を使用し、同一空間レイヤにおける輝度の形状320から直接導出することができる。これらの正確に導出された形状により、クロミナンス成分を正確に復号することができる。
【0035】
図6は、任意解像度のクロミナンス成分600における欠落クロミナンス値周囲のクロミナンス値の相対位置を示す図である。サブサンプリングフィルタの特性のために、クロミナンスの形状の境界のはじまり(leading boundary)において、輝度がオブジェクトマスクの形状の中にある画素について、対応するクロミナンスのテクスチャ内に欠落クロミナンスが生じ得ることに注意すべきである。例えば、この欠落クロミナンス値610は、クロミナンス平面内の3つの近傍クロミナンス値620〜640(即ち、欠落クロミナンス値の右側のクロミナンス値C1、真下のクロミナンス値C2及び右下の隅のクロミナンス値C3)の平均値をとって補間することができる。3つの近傍クロミナンス値のどれかが形状の外側にある場合は、その外側値は平均値に入れない。この形状適応ウェーブレット変換は、3つの近傍クロミナンス値の少なくとも1つが形状内にあることを保証する。
【0036】
本発明の教示を含む種々の実施態様につき詳細に図示説明して来たが、本技術に熟達した人であれば、これらの教示を含む他の変更実施態様を容易に考案できるであろう。
【0037】
添付図面を参照し、明細書の詳細説明を検討すれば、本発明の教示内容がよく理解できるであろう。
理解を容易にするために、図面に共通の同一要素にはできる限り同一の参照番号をつけて示した。
【図面の簡単な説明】
【図1】 図1は、本発明によるオブジェクト指向符号化/復号システムのブロック図である。
【図2】 図2は、図1のオブジェクト指向符号化/復号システムの詳細ブロック図である。
【図3】 図3は、任意形状画像及び動画像中の輝度とクロミナンス用形状符号化とテクスチャ符号化のスケーラビリティを示すブロック図である。
【図4】 図4は、任意形状画像及び動画像中の輝度とクロミナンス用形状符号化とテクスチャ符号化のスケーラビリティを提供する本発明のウェーブレット分割構造を示すブロック図である。
【図5】 図5は、本発明による形状又はマスク符号化方法のフローチャートである。
【図6】 図6は、クロミナンス平面における欠落クロミナンス値近傍のクロミナンス値の相対位置を示すブロック図である。

Claims (10)

  1. 輝度及びクロミナンスのテクスチャ情報並びに輝度の形状情報を有する入力画像を符号化する方法において、
    (a)第1のフィルタ関数から第Nのフィルタ関数までを有する複数のサブバンドフィルタ関数を前記入力画像に適用して複数レベルの輝度テクスチャを得るステップと、
    (b)前記複数のサブバンドフィルタ関数に対応する複数のサブサンプリング関数を前記入力画像に適用して複数レベルの形状情報を得るステップと、
    (c)前記複数のサブサンプリング関数の対応第1のサブサンプリング関数を前記複数の輝度形状情報からの全解像度の輝度形状情報に適用し全解像度クロミナンス形状情報を得るステップと、
    (d)前記対応第2から第Nまでのサブバンドフィルタ関数を前記クロミナンステクスチャ情報に適用して複数レベルのクロミナンステクスチャ情報を得るステップと、
    (e)前記複数レベルの輝度のテクスチャ情報及び形状情報並びに前記複数レベルのクロミナンスのテクスチャ情報をビットストリームに符号化するステップとを含んでなることを特徴とする入力画像の符号化方法。
  2. 前記ステップ(c)は、奇対称フィルタ関数である対応第1サブサンプリング関数を適用することを特徴とする請求項1に記載の輝度及びクロミナンスのテクスチャ情報並びに輝度及びクロミナンスの形状情報を有する入力画像を符号化する方法。
  3. 前記ステップ(c)は、偶対称フィルタ関数である対応第1サブサンプリング関数を適用することを特徴とする請求項1に記載の輝度及びクロミナンスのテクスチャ情報並びに輝度及びクロミナンスの形状情報を有する入力画像を符号化する方法。
  4. 前記ステップ(a)は、複数の異なるサブバンドフィルタ関数を適用して前記複数レベルの輝度テクスチャ情報を得ることを特徴とする請求項1に記載の輝度及びクロミナンスのテクスチャ情報並びに輝度及びクロミナンスの形状情報を有する入力画像を符号化する方法。
  5. 3つの近傍クロミナンス値の平均をとり、前記複数レベルのクロミナンステクスチャ情報の1レベル範囲内における欠落クロミナンス値を補間するステップをさらに含むことを特徴とする請求項1に記載の輝度及びクロミナンスのテクスチャ情報並びに輝度及びクロミナンスの形状情報を有する入力画像を符号化する方法。
  6. 輝度及びクロミナンスのテクスチャ情報並びに輝度の形状情報を有する入力画像を表わすビットストリームを復号する方法において、
    (a)第1の逆フィルタ関数から第Nの逆フィルタ関数までを有する複数の逆サブバンドフィルタ関数の少なくとも1つを前記ビットストリームに適用して複数レベルの輝度テクスチャ情報の少なくとも1つを得るステップと、
    (b)複数の対応逆サブサンプリング関数の少なくとも1つを前記ビットストリームに適用して複数レベルの輝度形状情報の少なくとも1つを得るステップと、
    (c)複数の対応逆サブサンプリング関数の少なくとも1つを前記複数レベルの輝度形状情報の1つに適用して同じ空間レベルにおける対応クロミナンス形状情報を得るステップと、
    (d)同じ空間レベルにおける前記対応クロミナンス形状情報を適用して同じ空間レベルにおけるクロミナンステクスチャ情報の復号を支援するステップと、
    (e)同じ空間レベルにおける前記輝度テクスチャとクロミナンステクスチャの情報の少なくとも1つを復号して入力画像のスケールバージョンを得るステップを含んでなることを特徴とする輝度及びクロミナンスのテクスチャ情報並びに輝度の形状情報を有する入力画像を表わすビットストリームの復号方法。
  7. 複数の命令を蓄積している計算機可読媒体(210)において、前記複数の命令はプロセッサにより実行される時にプロセッサに、
    (a)第1のフィルタ関数から第Nのフィルタ関数までを有する複数のサブバンドフィルタ関数を前記入力画像に適用して複数レベルの輝度テクスチャを得るステップと、
    (b)前記複数のサブバンドフィルタ関数に対応する複数のサブサンプリング関数を前記入力画像に適用して複数レベルの形状情報を得るステップと、
    (c)前記複数のサブサンプリング関数の対応第1サブサンプリング関数を前記複数の輝度形状情報からの全解像度の輝度形状情報に適用して全解像度クロミナンス形状情報を得るステップと、
    (d)前記対応第2から第Nまでのサブバンドフィルタ関数を前記クロミナンステクスチャ情報に適用して複数レベルのクロミナンステクスチャ情報を得るステップと、
    (e)前記複数レベルの輝度のテクスチャ情報及び形状情報並びに前記複数レベルのクロミナンステクスチャ情報をビットストリームに符号化するステップを実行させる命令を含んでなることを特徴とする計算機可読媒体(210)。
  8. 複数の命令を蓄積している計算機可読媒体(270)において、前記複数の命令はプロセッサにより実行される時にプロセッサに、
    (a)第1の逆フィルタ関数から第Nの逆フィルタ関数までを有する複数の逆サブバンドフィルタ関数の少なくとも1つを前記ビットストリームに適用して複数レベルの輝度テクスチャ情報の少なくとも1つを得るステップと、
    (b)複数の対応逆サブサンプリング関数の少なくとも1つを前記ビットストリームに適用して複数レベルの輝度形状情報の少なくとも1つを得るステップと、
    (c)複数の対応逆サブサンプリング関数の少なくとも1つを前記複数レベルの輝度形状情報の1つに適用して同じ空間レベルにおける対応クロミナンスの形状情報を得るステップと、
    (d)同じ空間レベルにおける前記対応クロミナンス形状情報を適用して同じ空間レベルにおけるクロミナンステクスチャ情報の復号を支援するステップと、
    (e)同じ空間レベルにおける前記輝度テクスチャとクロミナンステクスチャの情報の少なくとも1つを復号して入力画像のスケールバージョンを得るステップを実行させる命令を含んでいることを特徴とする計算機可読媒体(270)。
  9. 輝度及びクロミナンスのテクスチャ情報並びに輝度の形状情報を有する入力画像を符号化する装置(210)において、
    第1のフィルタ関数から第Nのフィルタ関数までを有する複数のサブバンドフィルタ関数を前記入力画像に適用し複数レベルの輝度テクスチャを得る手段(220)と、
    複数のサブバンドフィルタ関数に対応する複数のサブサンプリング関数を前記入力画像に適用して複数レベルの形状情報を得る手段(211)と、
    前記複数のサブサンプリング関数の対応第1サブサンプリング関数を前記複数の輝度形状情報からの全解像度の輝度形状情報に適用して全解像度のクロミナンス形状情報を得る手段(211)と、
    前記対応第2から第Nまでのサブバンドフィルタ関数を前記クロミナンステクスチャ情報に適用して複数レベルのクロミナンスのテクスチャ情報を得る手段(220)と、
    前記複数レベルの輝度のテクスチャ情報及び形状情報並びに前記複数レベルのクロミナンスのテクスチャ情報をビットストリームに符号化する手段(211,220)とを含んでなることを特徴とする入力画像の符号化装置(210)。
  10. 輝度及びクロミナンスのテクスチャ情報並びに輝度形状情報を有する入力画像を表わすビットストリームを復号する装置(270)において、
    第1の逆フィルタ関数から第Nの逆フィルタ関数までを有する複数の逆サブバンドフィルタ関数の少なくとも1つを前記ビットストリームに適用して複数レベルの輝度テクスチャ情報の少なくとも1つを得る手段(272)と、
    複数の対応逆サブサンプリング関数の少なくとも1つを前記ビットストリームに適用し複数レベルの輝度形状情報の少なくとも1つを得る手段(274)と、 複数の対応逆サブサンプリング関数の少なくとも1つを前記複数レベルの輝度形状情報の1つに適用して同じ空間レベルにおける対応クロミナンスの形状情報を得る手段(274)と、
    同じ空間レベルにおける前記対応クロミナンス形状情報を適用して同じ空間レベルにおけるクロミナンスのテクスチャ情報の復号を支援する手段(272)と、
    同じ空間レベルにおける前記輝度テクスチャとクロミナンスのテクスチャ情報の少なくとも1つを復号して入力画像のスケールバージョンを得る手段(272)を含んでなることを特徴とする輝度及びクロミナンスのテクスチャ情報並びに輝度形状情報を有する入力画像を表わすビットストリームの復号装置(270)。
JP2000569355A 1998-09-08 1999-09-08 サブバンドの符号化/復号 Expired - Lifetime JP4382284B2 (ja)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US9937998P 1998-09-08 1998-09-08
US60/099,379 1998-09-08
US09/391,058 1999-09-07
US09/391,058 US6459814B1 (en) 1998-09-08 1999-09-07 Method and apparatus for generic scalable shape coding by deriving shape information for chrominance components from luminance component
PCT/US1999/020679 WO2000014685A1 (en) 1998-09-08 1999-09-08 Subband coding/decoding

Publications (3)

Publication Number Publication Date
JP2003533064A JP2003533064A (ja) 2003-11-05
JP2003533064A5 JP2003533064A5 (ja) 2005-05-26
JP4382284B2 true JP4382284B2 (ja) 2009-12-09

Family

ID=22274727

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000569355A Expired - Lifetime JP4382284B2 (ja) 1998-09-08 1999-09-08 サブバンドの符号化/復号

Country Status (6)

Country Link
US (1) US6459814B1 (ja)
EP (1) EP1110179B1 (ja)
JP (1) JP4382284B2 (ja)
AU (1) AU5914899A (ja)
DE (1) DE69915843T2 (ja)
WO (1) WO2000014685A1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6683992B2 (en) * 1999-12-28 2004-01-27 Matsushita Electric Industrial Co., Ltd. Image decoding apparatus and image coding apparatus
KR100366382B1 (ko) * 2001-02-12 2002-12-31 (주) 멀티비아 동영상 부호화 장치 및 방법
US6931063B2 (en) 2001-03-26 2005-08-16 Sharp Laboratories Of America, Inc. Method and apparatus for controlling loop filtering or post filtering in block based motion compensationed video coding
US7929610B2 (en) 2001-03-26 2011-04-19 Sharp Kabushiki Kaisha Methods and systems for reducing blocking artifacts with reduced complexity for spatially-scalable video coding
US7450641B2 (en) 2001-09-14 2008-11-11 Sharp Laboratories Of America, Inc. Adaptive filtering based upon boundary strength
EP1267568A1 (en) * 2001-06-11 2002-12-18 STMicroelectronics Limited A method and circuitry for processing data
US7630569B2 (en) * 2002-02-26 2009-12-08 Decegama Angel Real-time software video/audio transmission and display with content protection against camcorder piracy
WO2003107678A1 (en) * 2002-06-18 2003-12-24 Koninklijke Philips Electronics N.V. Video encoding method and corresponding encoding and decoding devices
US7561208B2 (en) * 2003-06-23 2009-07-14 Nxp B.V. Method and decoder for composing a scene
DE602004017689D1 (de) * 2003-11-21 2008-12-24 Samsung Electronics Co Ltd Vorrichtung und Methode zur Erzeugung von kodierten Blockanordnungen für ein Alpha-Kanalbild sowie Alpha-Kanalkodierungs und -dekodierungsvorrichtung und -methode.
KR100763178B1 (ko) * 2005-03-04 2007-10-04 삼성전자주식회사 색 공간 스케일러블 비디오 코딩 및 디코딩 방법, 이를위한 장치
US7961963B2 (en) 2005-03-18 2011-06-14 Sharp Laboratories Of America, Inc. Methods and systems for extended spatial scalability with picture-level adaptation
US8036473B1 (en) * 2006-01-17 2011-10-11 Teradici Corporation Pixel selective wavelet transform methods
US8567503B2 (en) * 2006-08-04 2013-10-29 Halliburton Energy Services, Inc. Composition and method relating to the prevention and remediation of surfactant gel damage
US20110026591A1 (en) * 2009-07-29 2011-02-03 Judit Martinez Bauza System and method of compressing video content
US9219916B2 (en) * 2012-06-12 2015-12-22 Dolby Laboratories Licensing Corporation Joint base layer and enhancement layer quantizer adaptation in EDR video coding
US10200716B2 (en) 2015-06-25 2019-02-05 Sony Interactive Entertainment Inc. Parallel intra-prediction encoding/decoding process utilizing PIPCM and/or PIDC for selected sections
CN109035446B (zh) * 2018-07-04 2020-09-15 安徽省徽腾智能交通科技有限公司泗县分公司 停车场自动收费系统

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4743959A (en) 1986-09-17 1988-05-10 Frederiksen Jeffrey E High resolution color video image acquisition and compression system
KR0181052B1 (ko) 1995-03-31 1999-05-01 배순훈 고화질 영상 시스템의 영역 분할 장치
US5982434A (en) * 1996-03-22 1999-11-09 Sony Corporation Image signal coding method and device thereof, image signal decoding method and device thereof, and recording medium
KR100209412B1 (ko) * 1996-05-10 1999-07-15 전주범 비디오 신호의 유호 색차 성분 부호화 방법
JP3210862B2 (ja) 1996-06-27 2001-09-25 シャープ株式会社 画像符号化装置及び画像復号装置
KR100281463B1 (ko) * 1998-03-14 2001-02-01 전주범 물체 기반 부호화 시스템의 보조 정보 부호화 장치

Also Published As

Publication number Publication date
US6459814B1 (en) 2002-10-01
DE69915843T2 (de) 2005-01-27
DE69915843D1 (de) 2004-04-29
AU5914899A (en) 2000-03-27
WO2000014685A1 (en) 2000-03-16
JP2003533064A (ja) 2003-11-05
EP1110179A1 (en) 2001-06-27
EP1110179B1 (en) 2004-03-24

Similar Documents

Publication Publication Date Title
JP4382284B2 (ja) サブバンドの符号化/復号
Cote et al. H. 263+: Video coding at low bit rates
KR100703788B1 (ko) 스무딩 예측을 이용한 다계층 기반의 비디오 인코딩 방법,디코딩 방법, 비디오 인코더 및 비디오 디코더
US6873655B2 (en) Codec system and method for spatially scalable video data
US7738716B2 (en) Encoding and decoding apparatus and method for reducing blocking phenomenon and computer-readable recording medium storing program for executing the method
US8275042B2 (en) High-performance video transcoding method
JP2005506815A (ja) 空間拡張可能圧縮のための方法及び装置
US20060165302A1 (en) Method of multi-layer based scalable video encoding and decoding and apparatus for the same
JP2005506815A5 (ja)
JP4226172B2 (ja) 適応的変換方法を用いる映像圧縮符号化装置および復号化装置ならびにその方法
EP1151410A1 (en) Image processing circuit and method for reducing a difference between pixel values across an image boundary
US20100086048A1 (en) System and Method for Video Image Processing
JP2009533938A (ja) 多階層基盤のビデオエンコーディング方法および装置
JP2005524352A (ja) 複数基準フレームに基づいた動き補償時間的フィルタ化を用いたスケーラブルなウェーブレット・ベースの符号化
JP2004520771A (ja) ドリフト補正を備えたビデオトランスコーダ
JPH08275172A (ja) ピクチャ形成方法
Molina et al. Toward a new video compression scheme using super-resolution
JPH10224790A (ja) 圧縮伸張された画像中のブロック状ノイズを除去するフィルタおよびフィルタ方法
US20020186774A1 (en) Process for changing the resolution of MPEG bitstreams, and a system and a computer program product therefor
JP4339784B2 (ja) 複数個のブロックとして符号化された圧縮ビットストリーム符号化ビデオを復号する方法。
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
Bhojani et al. Hybrid video compression standard
JP3798432B2 (ja) ディジタル画像を符号化および復号化する方法および装置
JP4193252B2 (ja) 信号処理装置及び方法、信号復号装置、並びに信号符号化装置
Akujuobi Application of Wavelets to Video Compression

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050517

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20051206

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060928

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080304

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080604

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080711

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090915

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090917

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121002

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4382284

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131002

Year of fee payment: 4

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

EXPY Cancellation because of completion of term