JP2005531258A - スケーラブルで頑強なビデオ圧縮 - Google Patents

スケーラブルで頑強なビデオ圧縮 Download PDF

Info

Publication number
JP2005531258A
JP2005531258A JP2004517730A JP2004517730A JP2005531258A JP 2005531258 A JP2005531258 A JP 2005531258A JP 2004517730 A JP2004517730 A JP 2004517730A JP 2004517730 A JP2004517730 A JP 2004517730A JP 2005531258 A JP2005531258 A JP 2005531258A
Authority
JP
Japan
Prior art keywords
frame
frames
spatial resolution
residual
coefficient
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004517730A
Other languages
English (en)
Inventor
デバーガ・マクハージー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hewlett Packard Development Co LP
Original Assignee
Hewlett Packard Development Co LP
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Development Co LP filed Critical Hewlett Packard Development Co LP
Publication of JP2005531258A publication Critical patent/JP2005531258A/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/36Scalability techniques involving formatting the layers as a function of picture distortion after decoding, e.g. signal-to-noise [SNR] scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/31Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the temporal domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/33Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability in the spatial domain
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/503Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving temporal prediction
    • H04N19/51Motion estimation or motion compensation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/59Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial sub-sampling or interpolation, e.g. alteration of picture size or resolution
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

【課題】 種々の装置に対応するようにスケーラブルであるが、また、輻輳およびフェージング特性が大きく変化するネットワークおよびチャネルによる任意の損失に関して頑強でもある、圧縮フォーマットを提供する。
【解決手段】 ビデオシーケンスにおけるフレームを、フレームの圧縮された推定値を生成し(618)、推定値を係数α(0<α<1)により調整し(620)、フレームと調整された推定値との間の残差を計算する(620)ことにより圧縮する。残差を、頑強かつスケーラブルな方法で符号化してもよい。

Description

本発明は、スケーラブルで頑強なビデオ圧縮に関する。
[背景]
ビデオ画像を格納するコストを削減するためにデータ圧縮が使用される。
データ圧縮はまた、ビデオ画像を送信する時間を短縮するためにも使用される。
インターネットは、小型のハンドヘルドから強力なワークステーションまでの範囲にわたる装置により、56Kbpsモデムから高速イーサネット(登録商標)リンクまでの範囲にわたる接続を介してアクセスされる。
この環境では、固定解像度および品質でのみ圧縮ビデオ画像を生成する厳格な圧縮フォーマットが、必ずしも適当であるとは限らない。
かかる厳格なフォーマットに基づく配信システムは、ビデオ画像を、ごく一部の装置には順調に配信する。
残りの装置は、まったく何も受信することができないか、またはそれらの処理能力およびそれらのネットワーク接続の能力に対して不十分な品質および解像度の画像を受信する。
さらに、伝送の不確実性は、品質および解像度に対して重大になる場合がある。
伝送の不確実性は、採用される配信戦略のタイプによって決まる可能性がある。
たとえば、インターネットおよび無線チャネルに対し、パケット損失は固有である。
これらの損失は、頑強性を考慮して設計されていない場合に多くの圧縮システムおよび通信システムに対し損害が大きい場合がある。
この問題は、配信時のネットワーク状態が大きく変化することに関する不確実性によって一層悪化する。
種々の装置に対応するようにスケーラブルであるが、また、輻輳およびフェージング特性が大きく変化するネットワークおよびチャネルによる任意の損失に関して頑強でもある、圧縮フォーマットがあることが非常に望ましい。
しかしながら、単一圧縮フォーマットでスケーラビリティおよび頑強性を得ることは単純ではない。
欧州特許出願公開第0578438号 欧州特許出願公開第0920216号 米国特許第5844628号 米国特許第5083206号 米国特許第5485210号 米国特許第4943855号 Ghanbari M 他,「Efficient H. 261-Based Two-Layer Video Codecs For ATM Networks」, 1995年4月1日, IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE INC. NEW YORK US, vol. 5, no. 2, p1051-8215 Li W,「Overview Of Fine Granularity Scalability In MPEG-4 Video Standard」, 2001年3月, IEE TRANSACTIONS ON CIRCUITS AND SYSTEMS FOR VIDEO TECHNOLOGY, IEEE INC. NEW YORK US, vol. 11, no. 3, p301-317 Furukawa T 他,「Hierarchical Sub-Band Coding Of Super High Definition Image With Daptive BLock-Size Multistage VQ」, 1993年12月1日, SIGNAL PROCESSING. IMAGE CAOMMUNICATION, ELSEVIER SCIENCE PUBLISHERS, AMSTERDAM NL, vol. 5, no. 5/6, p527-538
[概要]
ビデオフレームを、フレームの圧縮された推定値を生成し、推定値を係数α(0<α<1)により調整し、フレームと調整された推定値との間の残差を計算することにより圧縮する。
残差を、頑強かつスケーラブルな方法で符号化してもよい。
本発明の他の態様および利点は、本発明の原理を例として示す添付図面を考慮して以下の詳細な説明から明らかとなろう。
[詳細な説明]
図1を参照する。
図1は、エンコーダ12と、伝送媒体14と、複数のデコーダ16と、を有するビデオ配信システムを示す。
エンコーダ12は、ビデオフレームのシーケンスを圧縮する。
シーケンスにおける各ビデオフレームを、フレームの圧縮された推定値を生成し、その推定値を係数αで調整し、フレームと調整された推定値との間の残差を計算することによって圧縮する。
エンコーダ10は、残差(R)をR=I−αIとして計算してもよく、Iは推定値であり、Iは処理されているビデオフレームである。
動き補償を使用して推定値を計算する場合、エンコーダ10は、動きベクトルと残差とを符号化し、その符号化された動きベクトルと符号化された残差とをビットストリーム(B)に付加する。
そして、エンコーダ10は、シーケンスにおける次のビデオフレームを符号化する。
ビットストリーム(B)は、伝送媒体14を介してデコーダ16に送信される。
インターネットまたは無線ネットワーク等の媒体は信頼性が低い場合がある。
パケットが破棄される可能性がある。
デコーダ16は、伝送媒体14を介してビットストリーム(B)を受信し、圧縮されたコンテンツからビデオフレームを復元する。
フレームの復元には、復号された少なくとも1つの先のフレームからフレームの推定値を生成すること、推定値を係数αによって調整すること、残差を復号すること、および復号された残差を調整された推定値に付加することが含まれる。
このように、各フレームは、1つまたは複数の先のフレームから復元される。
ここで、符号化および復号についてより詳細に説明する。
推定値を、いかなる方法で生成してもよい。
しかしながら、ビデオフレームの固有の時間的または時間ベースの冗長性を利用することにより、圧縮効率を上げることができる。
ビデオフレームのシーケンス内の大部分の連続するフレームは、圧縮されているフレームの前と後との両方のフレームに非常に類似する。
フレーム間予測は、ブロックベースの動き補償予測として知られる技法を使用してこの時間的冗長性を利用する。
推定値は、予測フレーム(Pフレーム)であってもよい。
Pフレームを、MPEG1、2および3等の既知のアルゴリズムまたはH.263ファミリ(H2.61、H2.63、H2.63+およびH2.63L)からのアルゴリズムをわずかに変更して使用することにより生成してもよい。
アルゴリズムを変更するのは、動きが、現フレーム(I)のブロックと先に調整された推定値のブロックとの間で確定されるためである。
現フレームのブロックを、先の調整された推定値における異なるブロックと比較し、比較毎に動きベクトルを計算する。
最少誤差を有する動きベクトルを、そのブロックの動きベクトルとして選択してもよい。
推定値を係数αで乗算することにより、推定値のピクセル値が低減する。
係数0<α<1により、符号化された残差に対する予測の寄与が低減し、それにより復元の予測への依存が小さくなり残差に対する依存が大きくなる。
残差に対しより多くのエネルギーが供給され、それにより圧縮効率が低下するが雑音の多いチャネルに対する頑強性が向上する。
係数αの値が低いほど、エラーに対する回復力が向上するが、圧縮効率は低下する。
係数αにより、復元されたフレームの次のいくつかの復元されたフレームに対する影響が制限される。
すなわち、復元されたフレームは、事実上、いくつかを除くすべての先行する復元されたフレームとは無関係である。
先行する復元されたフレームにエラーがあるか、または復号において解像度が低減することにより何らかの不整合があった場合であっても、あるいは、デコーダ16が先に復元されたフレームの間違ったバージョンを有する場合であっても、そのエラーは、次の少しの復元されたフレームに対してのみ伝播し、最終的には弱くなり、デコーダ16は再びエンコーダと同期することができるようになる。
係数αは、好ましくは0.6と0.8との間である。
たとえば、α=0.75である場合、エラーの影響は、0.75=0.1として8フレーム内で10%まで低減し、初期であっても視覚的に知覚されない。
α=0.65である場合、エラーの影響は、0.65=0.075として6フレーム内で7.5%まで低減する。
視覚的に、まずPフレームのエラーが、現フレームにおいて位置がずれた不整合ブロックとして現れる。
α=1である場合、連続したフレームにわたって同じエラーが有効であり続ける。
不整合ブロックは、より小さいブロックに分割されフレームからフレームに動きベクトルとともに伝播する可能性があるが、不整合領域におけるピクセルエラーの強度は低下しない。
一方、α=0.6〜0.8以下である場合、不整合ブロックがより小さいブロックに分割されると同時に、フレームからフレームにエラーの強度は低下し続ける。
係数αを、伝送信頼性に従って調整してもよい。
係数αは、エンコーダ12とデコーダ16とがともに予め既知である事前に定義された設計パラメータであってもよい。
代替例では、係数αを、それがビットストリームヘッダに含まれるリアルタイム送信シナリオで送信してもよい。
エンコーダ16が、利用可能な帯域幅と現パケット損失率とに基づいて係数αの値を実行中に決定してもよい。
エンコーダ10を、種々の方法で実施してもよい。
たとえば、エンコーダ10は、符号化を実行する専用プロセッサを有するマシンであってもよく、汎用プロセッサ110と、プロセッサ110に対し符号化等を実行するよう命令するようにプログラムされたメモリ112と、を有するコンピュータであってもよい。
デコーダ16は、小型ハンドヘルドから強力なワークステーションまでにわたってもよい。
復号機能を、種々の方法で実施してもよい。
たとえば、復号を、専用プロセッサ、または汎用プロセッサ116と、汎用プロセッサ110に対しメモリにおける符号化されたプログラムの復号等を実行するよう命令するようにプログラムされたメモリ118と、によって実行してもよい。
復元されたフレームはいくつかを除くすべての先行する復元されたフレームと視覚的に無関係であるため、残差をスケーラブルな方法で符号化することができる。
スケーラブルなビデオ圧縮は、能力が異なるデコーダ16が関連するストリーミングビデオの用途に対して有用である。
デコーダ16は、その処理帯域幅内にあるビットストリームのその部分を使用し、残りを破棄する。
スケーラブルなビデオ圧縮はまた、ビデオが、利用可能な帯域幅とデータ損失特性が広範囲であるネットワークによって送信される場合にも有用である。
MPEGおよびH.263アルゴリズムはIフレームを生成するが、Iフレームは、ビデオ符号化に対し、初期フレームにおいてでさえ必要ではない。
復号は、ビットストリーム(B)の任意の点で開始することができる。
係数αを使用することにより、第1の数枚の復号されたPフレームにエラーがあるが、その後10フレームほどのうちに、デコーダ16はエンコーダ12と同期するようになる。
たとえば、エンコーダ12とデコーダ16とを、すべてグレーのフレームで初期化してもよい。
エンコーダ12は、Iフレームまたは他の基準フレームを送信する代りに、すべてグレーのフレームから符号化を開始する。
同様に、デコーダ16は、すべてグレーのフレームから復号を開始する。
すべてグレーのフレームを、規約によって決定してもよい。
このように、エンコーダ12は、すべてグレーのフレーム、Iフレームまたは他の基準フレームをデコーダ16に送信しなくてもよい。
ここで、スケーラブル符号化をより詳細に説明する図2〜図5を参照する。
ウェーブレット分解は、自然に空間スケーラビリティをもたらすため、従来のDCTベースの符号化の代りに、残差のフレームのウェーブレット符号化を使用する。
各画像が3つの成分、すなわちY、Cb、Crに分解されるカラー画像を考える。
ここで、Yは輝度であり、Crは赤色差であり、Cbは青色差である。
通常、CbおよびCrは、Yの解像度の半分である。
かかるフレームを符号化するために、双直交フィルタを用いる第1のウェーブレット分解を実行する。
たとえば、2レベル分解を行う場合、サブバンドは図2に示すように見える。
しかしながら、任意の数の分解レベルを使用してもよい。
サブバンド分解からもたらされる係数を量子化する。
次に、量子化された係数を最低から最高のサブバンド順に走査し符号化して、層毎に1オクターブ増大する徐々に解像度が高くなる復元をもたらす空間解像度層をもたらす。
第1(最低)の空間解像度層は、Y、CbおよびCr成分のサブバンド0に関する情報を含む。
第2の空間解像度層は、Y、CbおよびCr成分のサブバンド1、2および3に関する情報を含む。
第3の空間解像度層は、Y、CbおよびCr成分のサブバンド4、5および6に関する情報を含む。
以下同様である。
走査中に使用される実際の係数符号化方法は、実施形態によって異なっていてもよい。
各空間解像度層における係数を、さらに複数の品質層または複数のSNR層に編成してもよい(SNRスケーラブル圧縮は、符号化されたビットストリームのサブセットを復号することにより品質の異なるビデオを復元することができるような方法で、シーケンスを復号化することを言う)。
ビットプレーン単位の符号化または多段ベクトル量子化を使用する逐次リファインメント(refinement)量子化を使用してもよい。
かかる方法では、係数をいくつかのパスで符号化し、各パスにおいて、空間解像度層に属する係数に対するより微細なリファインメントを符号化する。
たとえば、3つ(Y、CbおよびCr)すべての成分のサブバンド0における係数は、複数のリファインメントパスで走査される。
各パスにより、異なるSNR層が生成される。
第1の空間解像度層は、最下位リファインメントが符号化された後に終了する。
次に、3つすべてのサブバンド1、2および3の3つ(Y、CbおよびCr)すべての成分を複数のリファインメントパスで走査することにより、第2の空間解像度層に対する複数のSNR層が得られる。
Pフレームに対する例示的なビットストリーム編成を図3に示す。
第1の空間解像度層(SRL1)がヘッダ(Hdr)に続き、第2の空間解像度層(SRL2)および後続する空間解像度層が第1の空間解像度層(SRL1)に続く。
各空間解像度層は、複数のSNR層を含む。
第1の空間解像度層の第1のSNR層に動きベクトル(MV)情報を付加することにより、動きベクトル情報が確実に最高解像度ですべてのデコーダ16に送信されるようにする。
代替例では、第1の空間解像度層に動きベクトルの粗い近似を提供してもよく、後続する空間解像度層において漸次動きベクトルが精緻化される。
かかるスケーラブルビットストリームから、種々のデコーダ16が、それらの利用可能な帯域幅とそれらの表示および処理能力とに相応した完全ではない解像度および品質をもたらす種々のサブセットを受け取ることができる。
より低い空間解像度および/またはより低い品質を得るために、単にビットストリームから層を破棄する。
SNR層のすべては受け取らないが空間層はすべて受け取るデコーダ16は、単純に残差フレームのより低い品質の復元を使用してビデオフレームを復元することができる。
デコーダ16における基準フレームがエンコーダ12における基準フレームと異なる場合であっても、係数αによりエラーは構築されない。
空間解像度層のすべては受け取らない(恐らくはSNR層のすべては使用しない)デコーダ16は、復号プロセスのすべての段階においてより低い解像度を使用する。
その基準フレームの解像度はより低く、受け取られた動きベクトルデータは、それに一致するように適当にスケールダウンされる。
実施形態によっては、デコーダ16は、そのより解像度の低い基準フレームに対しサブピクセル動き補償を使用して解像度がより低い予測フレームを得てもよく、あるいは、より高速な実施形態に対し動きベクトルの精度を切り捨ててもよい。
後者の場合、導入されるエラーは前者の場合より多く、したがって、復元される品質はより不十分なものとなるが、いずれの場合も、係数αにより、確実にエラーが急速に減少し伝播しない。
量子化された残差係数データは、所与の解像度までしか復号されず、その後逆量子化と適当なレベルの逆変換とが行われ、それによってより解像度が低い残差フレームがもたらされる。
この解像度がより低い残差フレームが調整された推定値に付加されることにより、解像度がより低い復元フレームがもたらされる。
この解像度がより低い復元フレームが、後に、シーケンスにおける次のビデオフレームを復元するための基準フレームとして使用される。
係数αによりトップダウンのスケーラビリティを組み込むことができる同じ理由から、信頼性の低い伝送媒体14によるパケット損失に対するより強度な保護も可能になる。
さらに、誤り訂正符号(ECC)を使用することにより頑強性を向上させることができる。
しかしながら、すべての符号化ビットを等しく保護することは帯域幅を無駄にしかつ/またはチャネル不整合状態における頑強性を低下させる可能性がある。
チャネル不整合は、チャネルが、設計上エラー保護が耐え得る状態より品質が悪化した場合に発生する。
特に、チャネルエラーはバーストで発生することが多いが、バーストはランダムにしか発生せず、概してそれほど頻繁には発生しない。
最悪の場合のエラーバーストに対してすべてのビットを保護することにより、帯域幅が無駄になる可能性があるが、平均的な場合に対して保護することにより、エラーバーストが発生した場合に完全な配信システム障害がもたらされる可能性がある。
帯域幅を最小限に低減し、頑強性を、各空間解像度層内の重要な情報と重要でない情報とに対する一様でない保護を使用することによって維持する。
情報における任意のエラーが破局的障害をもたらす場合、その情報は重要である(少なくともエンコーダ12およびデコーダ16が再び同期するまで)。
たとえば、重要な情報は、次に続くビットの長さを示す。
エラーが品質の劣化をもたらすが同期化の破局的損失をもたらさない場合、情報は重要でない。
最悪の場合のエラーバーストに耐えるために重要な情報を厳しく保護する。
重要な情報はビットストリームのわずかな部分しか形成しないため、帯域幅の浪費は大幅に低減される。
重要でないビットを、これらに対するエラーの影響がいかに重要でないかによってさまざまなレベルの保護により保護してもよい。
激しいパケット損失および/またはビットエラーをもたらすエラーバースト中、重要でない情報において発生するエラーもある。
しかしながら、それらエラーは破局的障害をもたらさない。
品質に穏やかな(graceful)劣化があるが、不適当な係数の復号の結果としてもたらされるいかなる劣化も迅速に回復される。
重要な情報の量を低減することにより、帯域幅浪費の量が低減され、さらに頑強性が保証される。
重要な情報の量を、ベクトル量子化(VQ)を使用することにより低減することができる。
一度に1つの係数を符号化するのではなく、いくつかの係数を合わせてグループ化して1つのベクトルにし、合わせて符号化する。
分類ベクトル量子化(Classified Vector Quantization)を使用してもよい。
各ベクトルをいくつかのクラスのうちの1つに分類し、分類インデックスに基づいていくつかの固定長ベクトル量子化器のうちの1つを使用する。
ベクトルを分類してもよい種々の方法がある。
分類を、符号化されるベクトルの統計に基づいてもよく、それにより、分類されたベクトルは数ビットにより各クラス内で効率的に表される。
分類を、ベクトルノルムに基づいてもよい。
多段ベクトル量子化(MSVQ)は、既知のVQ技法である。
ベクトルの多段は、SNRスケーラビリティのみに関する。
各段に対して使用されるビットは、異なるSNR層の一部となる。
各連続した段は、さらに、ベクトルの復元を精緻化する。
各ベクトル量子化器に対して分類インデックスを生成する。
異なるベクトル量子化器は長さが異なる可能性があるため、分類インデックスを重要な情報の間に含める。
分類インデックスにエラーが発生した場合、その点からの復号動作全体に障害が発生する(同期化が再度確立されるまで)。
それは、続く実際のVQインデックスで使用されるビットの数もまたエラーとなるためである。
エラーはベクトルを越えて伝播しないため、各クラスに対するVQインデックスは重要ではない。
図4は、かかる準固定長符号化に対する例示的な戦略を示す。
各サブバンドにおける量子化された係数を、2×2または4×4のサイズの小さい独立したブロックにグループ化し、各ブロックに対し分類インデックス(または複合分類インデックス)を伝達するために数ビットを送信する。
所与の分類インデックスに対し、ブロック全体を符号化するために使用される実際のビットは固定になる。
分類インデックスを重要な情報の間に含め、固定長符号化ビットを重要でない情報の間に含める。
ベクトル量子化器のサイズを増大させることにより、より多くの係数を合わせて符号化することができ、より少ない重要な分類ビットを生成することができる。
生成される重要な分類ビットが少なくなる場合、厳しく保護する必要のあるビットの数が少なくなる。
したがって、帯域幅のペナルティが低減される。
図5を参照すると、各Pフレームのビットストリームを、各空間解像度層の第1のSNR層が重要な情報のすべてを含むように編成することができる。
このため、第1の空間解像度層の第1のSNR層は、動きベクトルと分類データとを含む。
第1の空間解像度層はまた、係数ブロックに対する第1段VQインデックスも含むが、第1段VQインデックスは重要でない情報の間にある。
第2の空間層の第1のSNR層は、分類データ等の重要な情報と、第1段VQインデックスおよび残差ベクトル等の重要でない情報と、を含む。
各空間解像度の第2のおよび後続するSNR層では、重要でない情報はさらに、残差ベクトルに対する精緻化データを含む。
重要な情報を厳しく保護してもよく、重要でない情報を緩く保護してもよい。
さらに、高い方のSNRおよび/または空間解像度層に対し、重要な情報と重要でない情報との両方に対する保護を軽減してもよい。
保護を、ブロック符号、重畳符号またはリード・ソロモン符号等の任意の順方向誤り訂正(FEC)方式によって提供してもよい。
FECの選択は、実際の実施形態によって決まることになる。
図6aおよび図6bは、ビデオ圧縮の第1の例を示す。
エンコーダをすべてグレーのフレームで初期化する(612)。
このため、基準フレームはすべてグレーのフレームである。
図6aを参照すると、ビデオフレームにアクセスし(614)、動きベクトルを計算する(616)。
予測フレーム
Figure 2005531258
は、基準フレームと計算された動きベクトルとに基づく(618)。
動きベクトルをビットストリームに配置する。
残差フレームを
Figure 2005531258
として計算する(620)次に、残差フレームRをスケーラブルな方法、すなわちRのウェーブレット変換(622)、残差フレームRの係数の量子化(624)およびサブバンド単位の準固定長符号化(626)により符号化する。
動きベクトルと符号化された残差フレームとをパックして、一様でないエラー保護を用いて複数の空間層とネスト化されたSNR層とにする(628)。
複数のSRL層をビットストリームに書き込む(630)。
別のビデオフレームを圧縮する必要がある場合(632)、次のビデオフレームに対して新たな基準フレームを生成する。
図6bを参照すると、ビットストリームを読み出し(650)、逆量子化を実行し(652)、逆変換を適用して復元された残差フレーム(R)をもたらす(654)ことにより、新たな基準フレームを生成してもよい。
ビットストリームと先の基準フレームとから読み出される動きベクトルを使用して、予測フレーム
Figure 2005531258
を復元する(656)。
予測フレームを、係数αによって調整する(658)。復元された残差フレーム(R)を調整された予測フレームに付加することにより復元フレーム(I)をもたらす(660)。
このため、
Figure 2005531258
である。
復元フレーム(I)を新たな基準フレームとして使用し、制御はステップ614に戻る。
図6bはまた、フレームを復元する方法も示す(652〜660)。
ビットストリームが生成されている際、それを、フレーム復元を実行するデコーダにストリーミングしてもよい。
第1のフレームを復号するために、デコーダを、すべてグレーの基準フレームに初期化してもよい。
動きベクトルと残差フレームとをスケーラブルな方法で符号化するため、デコーダは、完全なビットストリームからより小さい切り捨てられたバージョンを抽出することにより、より低い空間解像度またはより低い品質の残差フレームおよび動きベクトルを復元することができる。
デコーダにおいてより低い品質および/または解像度の復元を使用することにより、基準フレームにいかなるエラーが発生しても、係数αによりエラーが数枚のフレーム内で指数関数的に減衰するため、それによって与えられる影響は限られている。
図7aおよび図7bは、ビデオ圧縮の第2の例を示す。
この第2の例では、PフレームとBフレームとを使用する。
Bフレームを、2つの最も近いPフレーム、すなわち一方は符号化されているBフレームの前であり他方は後であるPフレームを使用して、双方向に予測してもよい。
図7aを参照すると、圧縮は、基準フレームFk=0をすべてグレーのフレームとして初期化することにより開始する(712)。
2つの連続するPフレームの間に合計n−1のBフレームを挿入する。
たとえば、n=4である場合、2つの連続するPフレームの間に3つのBフレームを挿入する。
次のPフレームにアクセスする(714)。
次のPフレームは、ビデオシーケンスにおけるkn番目のフレームであり、ここでknはインデックスnとインデックスkとの積である。
シーケンスにおけるフレームの総数が少なくともkn+1でない場合、最後のフレームをPフレームとして処理する。
Pフレームを符号化し(716〜728)ビットストリームに書き込む(730)。
別のビデオフレームを処理するべきである場合(732)、次の基準フレームを生成する(734〜744)。
次の基準フレームが生成された後、Bフレームを処理する(746)。
図7bに、Bフレーム処理を示す。
Bフレームは、インデックスr=kn−n+1を使用する(752)。
Bフレームインデックステスト(r<0またはr≧kn)が真である場合(754)、Bフレーム処理を終了する。
初期Pフレームの場合、k=0でありr=−3であり、したがって、いかなるBフレームも予測しない。
インデックスkがk=1まで増分すると(図7aの748)、次のPフレームI(k=1およびn=4であるためI=4)を符号化する。
この時、r=1であり、次のBフレームIを処理する(756〜770)ことにより、複数の空間解像度層を生成する。
インデックスrをr=2まで増分し(774)テストをパスし(754)、それによりBフレームIを処理する(756〜770)。
同様に、BフレームIを処理する(756〜770)。
しかしながら、r=4の場合、テストは真であり(754)、Bフレーム処理は停止するため、次のPフレームを処理する(図7a)。
符号化順は、フレームP…に対応するI12であるが、時間的順序は、Pとなる。
Bフレームにおけるエラーは他のフレームに伝播しないため、Bフレームは係数αで調整しない。
各フレームに対するかかるスケーラブルなビットストリームから、異なるデコーダは、それらの利用可能な帯域幅および表示/処理能力に相応する完全ではない解像度および/または品質をもたらす異なるサブセットを受け取ることができる。
SNRの低いデコーダは、単純に、Bフレームの品質の低いバージョンを復号する。
空間解像度の低いデコーダは、その解像度の低い基準フレームに対しサブピクセル動き補償を使用して解像度の低い予測フレームを得てもよく、あるいは、より高速な実施形態の場合動きベクトルの精度を切り捨ててもよい。
品質の低い復号フレームは復号フレームのエンコーダのバージョンと異なり、解像度の低い復号フレームはダウンサンプリングされた完全な解像度の復号フレームとは異なるが、導入されるエラーは、通常現フレームにおいてわずかであり、Bフレームであるため、エラーは伝播しない。
Bフレームに対するすべてのデータをPフレームに対するデータから分離する場合、時間スケーラビリティが自動的に得られる。
この場合、時間スケーラビリティは、ビットストリームの第1のレベルのスケーラビリティを構成する。
図8に示すように、第1の時間層は、Pフレームデータのみを含み、第2の層はBフレームのすべてに対するデータを含む。
別法として、Bフレームデータをさらに複数のより高い時間層に分離してもよい。
各時間層は、ネスト化された空間層を含み、空間層はネスト化されたSNR層を含む。
すべての層に対し、一様でないエラー保護を適用してもよい。
符号化および復号は、PフレームおよびBフレームに限定されない。
MPEG1、2および4ならびにH.261、H.263、H.263+およびH.263L等の符号化方式によって生成されるイントラフレームを使用してもよい。
符号化方式のMPEGファミリは、PフレームまたはBフレームによって多重化される周期的Iフレーム(通常15の周期)を使用するが、H.263ファミリ(H.261、H.263、H.263+、H.263L)では、Iフレームは周期的に繰り返さない。
基準フレームとしてイントラフレームを使用してもよい。
それらにより、エンコーダおよびデコーダが同期することができる。
本発明は、上に説明し例示した特定の実施形態に限定されない。
代りに、本発明は、添付の特許請求の範囲に従って解釈される。
本発明の実施形態によるビデオ配信システムの図である。 Y−Cb−Crカラー画像に対する2レベルサブバンド分解の図である。 符号化されたPフレームの図である。 準固定長符号化方式の図である。 符号化されたPフレームを含むビットストリームの一部の図である。 本発明の実施形態によるスケーラブルなビデオ圧縮の第1の例のフローチャートである。 本発明の実施形態によるスケーラブルなビデオ圧縮の第1の例のフローチャートである。 本発明の実施形態によるスケーラブルなビデオ圧縮の第2の例のフローチャートである。 本発明の実施形態によるスケーラブルなビデオ圧縮の第2の例のフローチャートである。 符号化されたPフレームと符号化されたBフレームとを含むビットストリームの一部の図である。
符号の説明
12・・・エンコーダ,
14・・・伝送媒体,
16・・・デコーダ,
112・・・プロセッサ,
114・・・メモリ,

Claims (10)

  1. ビデオフレームのシーケンスを圧縮する装置(12)であって、
    前記シーケンスにおける各フレームの推定値を生成し、係数α(0<α<1)により各推定値を調整し、該調整された推定値に対し残差フレームを計算するプロセッサ(112)
    を具備する装置。
  2. 前記プロセッサ(112)は、すべてグレーの基準フレームで初期化される
    請求項1に記載の装置。
  3. 前記推定値はPフレームである
    請求項1に記載の装置。
  4. 追加のフレームが推定され、該推定されるフレームのいくつかはPフレームであり、他のフレームはBフレームであり、前記Pフレームのみが前記係数αによって調整される
    請求項1に記載の装置。
  5. 前記係数αは、0.6〜0.8の範囲内にある
    請求項1に記載の装置。
  6. 前記係数αは、伝送信頼性に従って調整される
    請求項1に記載の装置。
  7. 前記プロセッサ(112)は、前記残差のサブバンド分解を実行し、該分解により、異なる空間解像度層がもたらされる
    請求項1に記載の装置。
  8. 前記プロセッサ(112)は、各空間解像度層を複数のSNR層に編成する
    請求項7に記載の装置。
  9. 前記プロセッサ(112)は、ベクトル量子化を使用して各空間解像度層の前記複数のSNR層を形成する
    請求項8に記載の装置。
  10. 各空間解像度層内の重要な情報と重要でない情報とは非一様に保護され、重要な情報は各空間解像度層の前記第1のSNR層に含まれ、重要な情報は重要でない情報より強度な保護が提供される
    請求項8に記載の装置。
JP2004517730A 2002-06-26 2003-06-19 スケーラブルで頑強なビデオ圧縮 Pending JP2005531258A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/180,205 US20040001547A1 (en) 2002-06-26 2002-06-26 Scalable robust video compression
PCT/US2003/019606 WO2004004358A1 (en) 2002-06-26 2003-06-19 Scalable robust video compression

Publications (1)

Publication Number Publication Date
JP2005531258A true JP2005531258A (ja) 2005-10-13

Family

ID=29778882

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004517730A Pending JP2005531258A (ja) 2002-06-26 2003-06-19 スケーラブルで頑強なビデオ圧縮

Country Status (6)

Country Link
US (1) US20040001547A1 (ja)
EP (1) EP1516494A1 (ja)
JP (1) JP2005531258A (ja)
AU (1) AU2003243705A1 (ja)
TW (1) TWI255652B (ja)
WO (1) WO2004004358A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016165054A (ja) * 2015-03-06 2016-09-08 日本放送協会 符号化装置、復号装置、及びプログラム

Families Citing this family (34)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1590965A2 (en) * 2003-01-29 2005-11-02 Koninklijke Philips Electronics N.V. Method of video coding for handheld apparatus
KR20070037488A (ko) 2004-07-13 2007-04-04 코닌클리케 필립스 일렉트로닉스 엔.브이. 공간 및 snr 화상 압축 방법
US7916952B2 (en) * 2004-09-14 2011-03-29 Gary Demos High quality wide-range multi-layer image compression coding system
JP4839035B2 (ja) * 2005-07-22 2011-12-14 オリンパス株式会社 内視鏡用処置具および内視鏡システム
US20070160134A1 (en) * 2006-01-10 2007-07-12 Segall Christopher A Methods and Systems for Filter Characterization
US8014445B2 (en) * 2006-02-24 2011-09-06 Sharp Laboratories Of America, Inc. Methods and systems for high dynamic range video coding
US8194997B2 (en) * 2006-03-24 2012-06-05 Sharp Laboratories Of America, Inc. Methods and systems for tone mapping messaging
US8401082B2 (en) * 2006-03-27 2013-03-19 Qualcomm Incorporated Methods and systems for refinement coefficient coding in video compression
US8184712B2 (en) 2006-04-30 2012-05-22 Hewlett-Packard Development Company, L.P. Robust and efficient compression/decompression providing for adjustable division of computational complexity between encoding/compression and decoding/decompression
US8422548B2 (en) * 2006-07-10 2013-04-16 Sharp Laboratories Of America, Inc. Methods and systems for transform selection and management
US8532176B2 (en) * 2006-07-10 2013-09-10 Sharp Laboratories Of America, Inc. Methods and systems for combining layers in a multi-layer bitstream
US7840078B2 (en) * 2006-07-10 2010-11-23 Sharp Laboratories Of America, Inc. Methods and systems for image processing control based on adjacent block characteristics
US8130822B2 (en) * 2006-07-10 2012-03-06 Sharp Laboratories Of America, Inc. Methods and systems for conditional transform-domain residual accumulation
US8059714B2 (en) * 2006-07-10 2011-11-15 Sharp Laboratories Of America, Inc. Methods and systems for residual layer scaling
US7885471B2 (en) * 2006-07-10 2011-02-08 Sharp Laboratories Of America, Inc. Methods and systems for maintenance and use of coded block pattern information
RU2426267C2 (ru) * 2007-01-08 2011-08-10 Нокиа Корпорейшн Усовершенствованное межуровневое предсказание для расширенной пространственной масштабируемости при кодировании видеосигнала
US8942505B2 (en) * 2007-01-09 2015-01-27 Telefonaktiebolaget L M Ericsson (Publ) Adaptive filter representation
US8665942B2 (en) * 2007-01-23 2014-03-04 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction signaling
US8503524B2 (en) * 2007-01-23 2013-08-06 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction
US8233536B2 (en) 2007-01-23 2012-07-31 Sharp Laboratories Of America, Inc. Methods and systems for multiplication-free inter-layer image prediction
US7826673B2 (en) * 2007-01-23 2010-11-02 Sharp Laboratories Of America, Inc. Methods and systems for inter-layer image prediction with color-conversion
US7760949B2 (en) * 2007-02-08 2010-07-20 Sharp Laboratories Of America, Inc. Methods and systems for coding multiple dynamic range images
US8767834B2 (en) 2007-03-09 2014-07-01 Sharp Laboratories Of America, Inc. Methods and systems for scalable-to-non-scalable bit-stream rewriting
JP5238069B2 (ja) * 2008-04-25 2013-07-17 フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ トランスポート・データストリーム内で参照するフレキシブル・サブストリーム
JP5786478B2 (ja) * 2011-06-15 2015-09-30 富士通株式会社 動画像復号装置、動画像復号方法、及び動画像復号プログラム
US9491487B2 (en) * 2012-09-25 2016-11-08 Apple Inc. Error resilient management of picture order count in predictive coding systems
US9788077B1 (en) * 2016-03-18 2017-10-10 Amazon Technologies, Inc. Rendition switching
US10869032B1 (en) 2016-11-04 2020-12-15 Amazon Technologies, Inc. Enhanced encoding and decoding of video reference frames
US10484701B1 (en) * 2016-11-08 2019-11-19 Amazon Technologies, Inc. Rendition switch indicator
US10264265B1 (en) 2016-12-05 2019-04-16 Amazon Technologies, Inc. Compression encoding of images
US10681382B1 (en) 2016-12-20 2020-06-09 Amazon Technologies, Inc. Enhanced encoding and decoding of video reference frames
US11076188B1 (en) 2019-12-09 2021-07-27 Twitch Interactive, Inc. Size comparison-based segment cancellation
US11153581B1 (en) 2020-05-19 2021-10-19 Twitch Interactive, Inc. Intra-segment video upswitching with dual decoding
JP2023535662A (ja) * 2021-06-28 2023-08-21 ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド ビデオを修復するための方法、装置、機器、媒体及びコンピュータプログラム

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4943855A (en) * 1988-07-22 1990-07-24 At&T Bell Laboratories Progressive sub-band image coding system
US5083206A (en) * 1990-03-19 1992-01-21 At&T Bell Laboratories High definition television arrangement including noise immunity means
US5218435A (en) * 1991-02-20 1993-06-08 Massachusetts Institute Of Technology Digital advanced television systems
JP3002019B2 (ja) * 1991-07-04 2000-01-24 富士通株式会社 セル廃棄補償機能を有する画像符号化伝送方式
US5367336A (en) * 1992-07-08 1994-11-22 At&T Bell Laboratories Truncation error correction for predictive coding/encoding
KR940003404A (ko) * 1992-07-23 1994-02-21 이헌조 프레임 간/프레임 내 움직임 보상 시스템
US5686964A (en) * 1995-12-04 1997-11-11 Tabatabai; Ali Bit rate control mechanism for digital image and video data compression
JPH11504490A (ja) * 1996-02-19 1999-04-20 フィリップス エレクトロニクス ネムローゼ フェンノートシャップ ビデオ信号符号化方法及び装置
JP3351705B2 (ja) * 1997-04-25 2002-12-03 日本ビクター株式会社 動き補償符号化装置、動き補償符号化方法、及び記録媒体への記録方法
EP0920216A1 (de) * 1997-11-25 1999-06-02 Deutsche Thomson-Brandt Gmbh Verfahren und Vorrichtung zur Codierung und zur Decodierung einer Bildsequenz
US6754277B1 (en) * 1998-10-06 2004-06-22 Texas Instruments Incorporated Error protection for compressed video

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016165054A (ja) * 2015-03-06 2016-09-08 日本放送協会 符号化装置、復号装置、及びプログラム

Also Published As

Publication number Publication date
WO2004004358A1 (en) 2004-01-08
TW200400766A (en) 2004-01-01
TWI255652B (en) 2006-05-21
US20040001547A1 (en) 2004-01-01
EP1516494A1 (en) 2005-03-23
AU2003243705A1 (en) 2004-01-19

Similar Documents

Publication Publication Date Title
JP2005531258A (ja) スケーラブルで頑強なビデオ圧縮
Wu et al. A framework for efficient progressive fine granularity scalable video coding
US6700933B1 (en) System and method with advance predicted bit-plane coding for progressive fine-granularity scalable (PFGS) video coding
Bolot et al. Adaptive error control for packet video in the Internet
Aaron et al. Transform-domain Wyner-Ziv codec for video
Franchi et al. Multiple description video coding for scalable and robust transmission over IP
US7369610B2 (en) Enhancement layer switching for scalable video coding
Gallant et al. Rate-distortion optimized layered coding with unequal error protection for robust internet video
KR100681168B1 (ko) 미세 입상 스케일 가능한 비디오를 위한 잔류 신호의인코딩 및 디코딩 시스템 및 그 방법
JP4109113B2 (ja) ビデオ伝送におけるビットストリーム間の切換
US20050163217A1 (en) Method and apparatus for coding and decoding video bitstream
Xiang et al. Scalable video coding with compressive sensing for wireless videocast
Yang et al. Robust transmission of SPIHT-coded images over packet networks
Girod et al. Scalable codec architectures for internet video-on-demand
Lee et al. An enhanced two-stage multiple description video coder with drift reduction
Adsumilli et al. Adapive Wireless Video Communications: Challenges and Approaches
Belyaev et al. Error concealment for 3-D DWT based video codec using iterative thresholding
Redmill et al. Error-resilient image and video coding for wireless communication systems
Pereira et al. Multiple description coding for internet video streaming
Kim et al. Error-resilient 3-D wavelet video coding with duplicated lowest sub-band coefficients and two-step error concealment method
Jagmohan et al. Two-channel predictive multiple description coding
Atta et al. An efficient layered video codec based on DCT pyramid
Chiang et al. Robust video transmission over mixed IP-wireless channels using motion-compensated oversampled filterbanks
Thillainathan et al. Robust embedded zerotree wavelet coding algorithm
Conci et al. Multiple description video coding by coefficients ordering and interpolation

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060221

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090325

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090901