JP2005518163A - メモリ−帯域幅が効率的なファイン・グラニュラ・スケーラビリティ(finegranularscalability:FGS)エンコーダ - Google Patents

メモリ−帯域幅が効率的なファイン・グラニュラ・スケーラビリティ(finegranularscalability:FGS)エンコーダ Download PDF

Info

Publication number
JP2005518163A
JP2005518163A JP2003568899A JP2003568899A JP2005518163A JP 2005518163 A JP2005518163 A JP 2005518163A JP 2003568899 A JP2003568899 A JP 2003568899A JP 2003568899 A JP2003568899 A JP 2003568899A JP 2005518163 A JP2005518163 A JP 2005518163A
Authority
JP
Japan
Prior art keywords
block
dct
bit plane
transform
bit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2003568899A
Other languages
English (en)
Inventor
ダー シャール,ミハエラ ヴァン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips Electronics NV filed Critical Koninklijke Philips Electronics NV
Publication of JP2005518163A publication Critical patent/JP2005518163A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/34Scalability techniques involving progressive bit-plane based encoding of the enhancement layer, e.g. fine granular scalability [FGS]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • H04N19/176Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object the region being a block, e.g. a macroblock
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/184Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being bits, e.g. of the compressed video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/42Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation
    • H04N19/423Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements
    • H04N19/426Methods or arrangements for coding, decoding, compressing or decompressing digital video signals characterised by implementation details or hardware specially adapted for video compression or decompression, e.g. dedicated software implementation characterised by memory arrangements using memory downsizing methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

ファイン・グラニュラ・スケーラビリティ(fine granular scalability)符号化の方法及び装置である。以下の段階は、画像フレーム中の個々の変換ブロックについて繰り返される。夫々の複数の残留係数は、夫々の変換ブロックに対して分解される。夫々の複数のビット平面又は不連続な量子化ステップは、画像フレーム中の次の変換ブロックについての係数を分解する前に夫々の変換ブロックに対して処理される。

Description

本発明は、ファイン・グラニュラ・スケーラビリティ(fine granular scalability:FGS)エンコーダの実現に関連する。
インターネット・プロトコル(IP)網を通じたビデオ・ストリーミングは、広範囲のマルチメディア・アプリケーションを可能としてきた。インターネット・ビデオ・ストリーミングは、インターネットを通じたサービスの質(QoS)の不足を補いつつ、連続的なマルチメディアコンテンツのリアルタイムの配送及び提示を行う。IP網を通じた帯域幅及び他のパフォーマンスパラメータ(例えばパケット損失率)のばらつき及び予測不可能性により、一般的に、提案される殆どのストリーミング解決策は、ある種の階層化された(又はスケーラブルな)ビデオ符号化方法に基づくものである。
このような、ビデオ・スケーラビリティ・アプローチは、MPEG−2、MPEG−4、及びH.263といったビデオ圧縮基準に採用されてきた。これらの標準では、時間スケーラビリティ、空間スケーラビリティ、及び質(SNR)スケーラビリティの種類が定義されてきた。これらの全ての種類のスケーラブルビデオは、ベースレイヤ(BL)及び1つ又はそれ以上のエンハンスメントレイヤ(EL)を含む。スケーラブル・ビデオ・ストリームのBL部は、一般的には、当該ストリームを復号化するのに必要なデータの最小量を表わす。ストリームのEL部は、追加的な情報を表わし、従って、受信器によって復号化されたときはビデオ信号表現を向上させる。
ファイン・グラニュラ・スケーラビリティ(fine granular scalability:FGS)は、ストリーミング用途のためにMPEG−4標準により近年採用された新しいビデオ圧縮の枠組みである。FGSは、一般的にはIPベースのネットワークを、特定的にはインターネットを特徴付ける、広範囲の帯域幅−変動シナリオをサポートすることが可能である。このタイプのスケーラビリティで符号化された画像は、プログレッシブに復号化される。即ち、デコーダは、非常に少量のデータを受信した後に画像の復号化及び表示を開始することができる。デコーダが更にデータを受信すると、復号化された画像の質は、完全な情報が受信され、復号化され、表示されるまで、プログレッシブに向上される。主要な国際標準のうちで、プログレッシブ画像符号化は、JPEGと、MPEG−4ビデオにおける静止画像のテクスチャ符号化ツールでサポートされているモードのうちの1つである。
ELは、プログレッシブ(埋込み)コーデックを用いてSNR及び時間的な残留データを圧縮する。このようにして、FGS残留信号は、最上位ビット平面から始めて最下位ビット平面で終わるまでビット平面毎に圧縮される(図1及び図2参照)。
図1は、フレーム全体に亘って、最上位ビット平面(MSB)100から最下位ビット平面(LSB)102へのプログレッシブ(ビット平面毎)符号化の従来のシーケンスを示す図である。単一の中間ビット平面101のみが示されているが、任意の数の中間ビット平面が符号化されうる。
図2は、FGSエンハンスメント・レイヤ残留DCT係数の走査順序を示す図である。走査は、MSB100から始まりLSB102へ向かう。図2中、ビット平面100及び101の代表的な部分のみが示されている。各8×8ビット平面ブロック200−204,206,210,211,214が、ブロックの左上の隅から始めて右下の隅で終わるよう従来のジグザグパターンを用いて走査される。本願では「ビット平面ブロック」という用語は、単一ビット平面内の残留データのうちの単一のブロックに対応する部分を示すものとする。
ビット平面ブロックは、左上の隅から始めて時計回りに進むよう4つのグループ(マクロブロック)ごとに走査される。走査は、第1のビット平面から開始する。つないでいる矢印は順序を示す。ブロック200の右下の隅を走査した後、走査はブロック201の左上の隅へ進む。ブロック201の右下の隅から、走査はブロック202の左上の隅へ進む。ブロック202の右下の隅から、走査はブロック203の左上の隅へ進む。ブロック203の右下の隅から、走査は次のマクロブロックへ進み、ブロック204の左上の隅から始める。第1のビット平面全体に対する走査がフレーム全体について完了した後、同じフレームについての第2のビット平面に対する走査が始まる。より一般的には、各ビット平面b=1,2,...mに対して、全てのブロックk=1,2,...nは、次のビット平面b+1の第1のブロックを始める前にビット平面b中の残留しているものについて走査する。
図3は、ベースレイヤ及びエンハンスメントレイヤに対する従来技術のFGSエンコーダ300を示す。図3は、ベースレイヤ・エンコーダ302及びエンハンスメントレイヤ・エンコーダ304についての機能アーキテクチャの一例を示す。図3は、DCT変換に基づく符号化動作を示すが、他の変換(例えばウエーブレット)もまた使用されうる。
ベースレイヤ302は、DCTブロック306、量子化ブロック308、及び元のビデオからBLストリームの部分を発生するエントロピー符号化器310を含む。更に、ベースエンコーダ302はまた、元のビデオから2組の動きベクトルを生成する動き推定ブロック320を含む。一組の動きベクトルはベースレイヤピクチャに対応し、他の一組は時間的なエンハンスメントフレームに対応する。マルチプレクサ(図示せず)は、ベースレイヤ動きベクトルをBLストリームで多重化するために含まれている。
図3に示すように、ベースレイヤ・エンコーダ302はまた、逆量子化ブロック312、逆DCTブロック314、動き補償ブロック316、及びフレームメモリ318を含む。
図3に示すように、ELエンコーダ304は、残留画像及びMC残留画像を記憶するDCT残留画像ブロック350を含む。残留画像は、量子化ブロック308の入力から主出力を差し引く減算器351によって発生される。
ELエンコーダ304はまた、残留画像のDCT係数を10進形式で含むメモリ352と、全てのFGSビット平面をママスク及び走査するマスク及び走査ブロック354とを含む。FGSエントロピー符号化ブロック356はまた、FGSエンハンスメント・ストリームを生成するために残留画像を符号化するよう含まれる。
FGSエンコーダ300(図3参照)の従来の実施例では、DCT変換306の後、DCT残留信号は、幾つかのビット平面(msbからlsbへ、又は、例えばbp_max等のある所定のビット平面へ)へ分解される。
次に、ビット平面は、ブロック354においてビット平面毎に走査され、ブロック356においてランレングス及びVLC符号化される。フレーム全体に対するビット平面の順次走査は、メモリ352中の記憶されたDCT係数への後のアクセスを必要とする。更に、メモリ352中のデータは2進形式(即ちビット平面ごとに)ではなく10進形式で保存されるため、特定のビット平面へのアクセスは、対応するデータを取り出すのみではなく、複雑なマスク操作を用いて所望のビット平面を抽出することも必要とする。
従来のエンコーダ300では、DCT残留係数を記憶するのに1つのメモリ352が必要である。更に、このメモリ352は、各ビット平面について繰り返しアクセスされる。更に、符号化されるべき所望のビット平面を取得するために、ブロック354において幾つかのマスク操作が行われる必要がある。また、以前のビット平面の圧縮に関する状態情報も記憶される必要がある。この処理は、かなりの量のメモリアクセス回数及び計算パワーを必要とする。
FGSデコーダ300の従来の実施例は、このように、計算の意味でもメモリアクセス回数(即ち帯域幅)の意味でも非効率的である。
本発明は、ファイン・グラニュラ・スケーラビリティ(fine granular scalability)符号化の方法及び装置である。以下のステップは、画像フレーム中の個々の変換ブロックについて繰り返される。複数の残留係数は夫々、各変換ブロックについて分解される。複数のビット平面又は不連続な量子化ステップは夫々、画像フレーム中の次の変換ブロックのために係数を分解する前に各変換ブロックに対して処理される。
本発明による望ましい方法では、フレーム全体に対するビット平面全体の走査は、もはや、フレーム全体に対して次に有意性の低いビット平面を走査する前には行われない。その代わりに、各ブロックは、フレーム内の続くブロックが処理される前に完全に(最上位ビット平面から最下位ビット平面へ、又は最上位ビット平面から所定のビット平面へ)走査される。
典型的な実施例は、FGSフレームを、メモリ帯域幅及び計算の複雑性が省かれるよう符号化する他の方法である。
この新規な方法の利点は、
・画像フレームに対して全てのDCT残留係数を同時に記憶するメモリは必要ないこと、
・様々なビット平面への帯域幅アクセスはかなり減少されること(殆ど無視できるほど小さくなること)、
・マスク処理は、各ビット平面に対して多数回行われるのではなく、係数ごとに一回だけ行われること、
・以前に符号化された(即ち最上位)ビット平面の符号化状態情報を記憶する必要はないこと、
・FGSの符号化はもはやFGS符号化のためのフレーム遅延を必要とせず、従って、ベース及びエンハンスメント・レイヤの処理はより密接につながれ、計算の複雑性及びメモリアクセスの両方においてより高い効率をもたらすこと、
である。
この方法を達成するために、DCT残留係数は、フレーム全体に対するビット平面を処理するのではなく、DCTブロック全体に対してすぐに処理される。一般的なアルゴリズムの疑似コードは以下の通りである。
アルゴリズム
For 画像内の各DCTブロックk
対応するビット平面中のDCT残留係数を直ぐに分解する
ブロックkに対するmax(|DC-coeff|)=Nmax(k)を計算する
For 各bビット平面<Nmax(k)
各ビット平面を処理する。即ち、これをランレングス及びVLC符号化する
既知の位置から始めて異なる位置に各ビット平面を記憶する
(このブロックが第1のブロックでない場合は、以前のブロックの既に符号化され
たビット平面bの後に符号化されたビット平面bを加える。)
N=全てのNmax(k)の最大 を計算する
様々なビット平面を有意性の順に(msbからlsbへ)加えることにより圧縮された
ビットストリームを作成する。
図4は、処理のためのFGSエンハンスメント・レイヤ残留DCT係数の走査順序を示す図である。走査順序は、図2に示す従来の走査順序から変更される。(しかしながら、いったん走査が完了すると、伝送順序は、図3に示す従来のエンコーダ300からの出力信号に対する伝送順序と同じである)。より具体的にいうと、ビット平面b上のビット平面ブロック400の左上の隅から右下の隅へ走査した後、走査は、ビット平面b+1のビット平面ブロック401の左上の隅へ進む。図4中、2つのビット平面(b及びb+1)のみが示されているが、任意の数のビット平面が存在しうる。ビット平面ブロック401の右下の隅へ走査した後、走査は、存在するのであれば第3のビット平面中の第1のビット平面ブロックの左上の隅へ進む。第1のブロックのビット平面ブロック400、401が各ビット平面に亘って走査した後にのみ、走査は第1のビット平面b中の第2の位置のブロックのビット平面ブロック410へ進む。より一般的には、任意のブロックkに対して、全てのビット平面b=1,2,...,n中のビット平面ブロックは、ブロックk+1の第1のビット平面ブロックの走査の前に走査される。
図6は、アルゴリズムを示すフローチャートである。
ステップ600において、ループが開始する。ステップ602乃至614は、画像フレーム内の個々の変換ブロック(例えばDCT)ブロックkに対して繰り返される。
ステップ602において、ブロックkについての全てのビット平面中の残留DCT係数は、直ぐに分解される。即ち、ビット平面全体についての係数がブロックごとに分解されるのではなく、ブロックkについての様々なビット平面ブロックがビット平面ごとに分解される。
ステップ604において、ステップ606がブロックkの各係数に対して繰り返されるループが開始される。ステップ606において、量(DC係数)の絶対値が計算される。
ステップ608において、ブロック(k)についてのNMAX(k)は、ブロックkについての全ての係数のうちのabs(DC係数)の最大値に設定される。
ステップ610において、ブロックkについて、各ビット平面bに対してステップ612及び614が繰り返されるループが開始される。
ステップ612において、ブロックkの各ビット平面が処理され、即ち、ランレングス及びVLC符号化される。
ステップ614において、ブロックkの各ビット平面ブロックは、既知の位置から始めて、夫々の異なる位置に記憶される。例えば、現在のブロックkが最初のブロックでなければ、ブロックkについての符号化されたビット平面bの部分は、以前のブロックk−1(図示せず)の既に符号化されたビット平面bの後に加えられる。このように、i番目のDCTブロックの各b番目のビット平面は、i−1番目のDCTブロックのb番目のビット平面の位置の直ぐ後に続く位置に記憶される(ただし、bは整数であり、iは1よりも大きい整数である)。ステップ612乃至614が各ビット平面bに対して繰り返された後、各ブロックkに対してステップ602乃至614が繰り返される。このように、複数のビット平面からのデータは、最大の大きさのうちの最大のものに対応するビット平面から始めて、圧縮されたビット平面内に配置される。
ステップ616において、ビット平面Nの総数は、全てのブロックのNMAX(k)の最大値に設定される。
ステップ618において、圧縮されたビットストリームは、様々なビット平面を有意性の順序(MSBからLSBへ)で加えることによって形成される。望ましくは、各ビット平面に対するデータは、圧縮されたビットストリームの中で、図3の従来技術のエンコーダ300によって発生された圧縮されたビットストリーム中で占めていたのと同じ位置に置かれる。このように、画像フレーム中の全てのDCTブロックに対して夫々の複数のビット平面を含む圧縮されたビットストリームが形成され、圧縮されたビットストリーム中のデータはビット平面で配置される。この圧縮されたビットストリームは、図3の従来のエンコーダ300からの出力を復号化するのが可能な任意のデコーダによって復号化されうる。
上述のアルゴリズムでは、分解中の後のアクセスのために、DCT残留信号をメモリに記憶することは必要でない。更に、様々なビット平面に対する連続的なマスク操作は必要でない。
図5は、ベースレイヤ及びエンハンスメント・レイヤ用の典型的なFGSエンコーダ500を示す。図5は、ベースレイヤ・エンコーダ502及びエンハンスメント・レイヤ・エンコーダ504の機能アーキテクチャの一例を示す。図5は、DCT変換に基づく符号化操作を示すが、他の変換(例えばウェーブレット)もまた使用されうる。
図5に示すように、ベースレイヤ・エンコーダ502は、DCTブロック506、量子化ブロック508、及び元のビデオからBLストリームの部分を発生するエントロピー符号化器410を含む。更に、ベースエンコーダ502はまた、元のビデオから2組の動きベクトルを生成する動き推定ブロック520を含む。動きベクトルの一方の組はベースレイヤピクチャに対応し、他方の組は時間的なエンハンスメントフレームに対応する。マルチプレクサ(図示せず)は、ベースレイヤ動きベクトルをBLストリームと多重化するために含まれる。
図5に示すように、ベースレイヤ・エンコーダ502はまた、逆量子化ブロック512、逆DCTブロック514、動き補償ブロック516、及びフレームメモリ518を含む。
ELエンコーダ504は、残留画像及びMC残留画像を記憶するDCT残留画像ブロック550を含む。残留画像は、量子化ブロック508の入力から出力を差し引く減算器551によって発生される。
ELエンコーダ504は、従来技術のELエンコーダ304中のメモリ352の残留記憶機能の役割を果たすメモリを必要としない。更に、ELエンコーダ504は、従来技術のELエンコーダ304で必要とされるような、全てのFGSビット平面をマスク及び走査するためのマスク及び走査ブロック354を必要としない。その代わりに、各ビット平面ブロックについてのビット平面残留ブロックは、DCT残留画像ブロック550から、FGSエンハンスメント・ストリームを生成するよう残留画像を符号化するために含まれるFGS走査及びエントロピー符号化ブロック553へ直接与えられる。
FGSエンコーダ500の典型的な実施例では、DCT変換506の後、各ブロック(例えば画像の左上のブロック)に対するDCT残留信号は、各ビット平面についてのビット平面ブロックが走査されるまで、ビット平面毎に連続的に幾つかのビット平面ブロックへ(msbからlsbへ、又は、ある所定のビット平面、例えばbp_maxへ)分解される。
各ブロックは、次に、個々にビット平面毎に走査され、コンパクトな実装のためにブロック553においてランレングス及びVLC符号化される。各ブロックについて、全てのビット平面についての残留画像データは、符号化ブロック553のために2進形式で利用可能であり、従って、複雑なマスク操作を行う必要はない。また、符号化ブロック553は、フレーム中の各ブロックからの単一のビット平面についてのデータの代わりに、一回に1ブロックについての全てのビット平面データを必要とするだけである。従って、従来技術においてこのために必要とされたような、大容量記憶装置352は必要とされない。
ファイン・グラニュラ・スケーラビリティ(fine granular scalability)符号化のための典型的な方法及びシステムは、FGSエンコーダの実現に必要なメモリ、メモリ帯域幅、及び計算上の複雑性を低減させる。更に、ベースレイヤ・エンコーダとエンハンスメント・レイヤ・エンコーダの間のつながりはより緊密となり、非必要な遅延及び記憶をなくすことにより、FGSコーデックのより効率的な実現を可能とする。
本願に開示する方法は、FSG符号化ツール、即ち選択的エンハンスメント及び周波数重み付けと共に適用されうる。周波数重み付けについては、フレーム全体に対して固定のマトリクスが適用され、従って、シフトはDCT変換の直後に実行されうる。選択的なエンハンスメントのために、特定のマクロブロックのビット平面のシフトは、ビット平面の実際の走査及びVLC符号化の直前に、又は、フレーム全体が符号化された後に行われうる。後者の方法は、より多くの柔軟性を与え、インタラクティブな選択的エンハンスメントを可能とするが、より複雑なメモリ及びストリーム管理という不利点を有する。
更に、この機構は、現在のFGS構造を越えて、MC−FGS(Motion-Compensation Fine Granular Scalability)及びP−FGS(Progressive Fine Granular Scalability)のような予測枠組みで使用されうる。PFGS及びMCFGSに対しては異なる処理が用いられるが、テクスチャ符号化(即ち、FGS走査及びエントロピー符号化)は同じである。従って、上述と同じ技術もまた、MC−FGS及びP−FGSに対して使用されうる。
典型的なエンコーダ500はDCT変換を用いるが、方法は他の変換にも使用されえ、例えばブロックベースのウェーブレット符号化又はマッチング追跡(matching pursuit)、並びに、他のSNRスケーラビリティ(ビット平面ではなく不連続な量子化ステップを用いる)に使用されうる。
本発明は、コンピュータに実装される方法及びこれらの方法を実装する装置を形で実現されうる。本発明はまた、例えばフレキシブルディスク、読み出し専用メモリ(ROM)、CD−ROM、ハードドライブ、高密度(例えば「ZIPTM」)リムーバブルディスクドライブ、又は任意の他のコンピュータ読み取り可能な記憶媒体といった有形の媒体中に具現化され、コンピュータにロードされコンピュータによって実行されると、コンピュータが本発明を実施する装置となる、コンピュータプログラムコードの形で実現されうる。本発明はまた、例えば、記憶媒体に記憶されているか、コンピュータの中にロードされ及び/又はコンピュータにより実行されるか、電気配線又はケーブルを通じて、光ファイバを通じて、或いは電磁放射を介してといった何らかの伝送媒体を通じて伝送されるかにかかわらず、コンピュータにロードされコンピュータによって実行されると、コンピュータが本発明を実施する装置となる、コンピュータプログラムコードの形で実現されうる。汎用プロセッサ上で実施されると、コンピュータプログラムコードセグメントは、プロセッサを特定の論理回路を形成するよう設定する。
本発明について、典型的な実施例に関して説明したが、これに限られるものではない。むしろ、特許請求の範囲は、本発明と同等のものの範囲を逸脱することなく当業者によってなされうる本発明の他の変形及び実施例を含むよう、広く解釈されるべきである。
フレーム全体に亘るMSBからLSBへのプログレッシブ(ビット平面ごとの)符号化の従来のシーケンスを示す図である。 FGSエンハンスメント・レイヤ残留DCT係数の従来の走査順序を示す図である。 従来のFGSエンコーダを示すブロック図である。 本発明による典型的なエンコーダ中のFGSエンハンスメント・レイヤ残留DCT係数の走査順序を示す図である。 本発明による典型的なエンコーダを示すブロック図である。 本発明によるFGSエンハンスメント・レイヤ残留DCT係数を処理する典型的な方法を示すフローチャートである。

Claims (20)

  1. (a)画像フレーム中の各個々の変換ブロックについて、
    (i)夫々の変換ブロックに対する夫々の複数の残留係数を分解する段階と、
    (ii)前記画像フレーム中の次の変換ブロックについての係数を分解する前に、夫々の変換ブロックについての夫々の複数のビット平面(b,b+1)又は不連続な量子化ステップを処理する段階と、
    を繰り返す段階を含む、
    ファイン・グラニュラ・スケーラビリティ(fine granular scalability)符号化方法。
  2. 前記変換ブロックは離散コサイン変換(DCT)ブロックであり、残留係数はDCT残留係数である、請求項1記載の方法。
  3. 前記段階(ii)は、前記複数のビット平面(b,b+1)の夫々をランレングス及び可変長符号化することを含む、請求項2記載の方法。
  4. 前記段階(a)は、更に、
    (iii)夫々の異なる位置に各ビット平面(b,b+1)を記憶する段階を含む、請求項2記載の方法。
  5. 前記DCTブロックのうちのi番目のDCTブロックの各b番目のビット平面は、前記DCTブロックのうちのi−1番目のDCTブロックのb番目のビット平面の場所の直後の場所に記憶され、ただし、bは整数であり、iは1よりも大きい整数である、請求項4記載の方法。
  6. (b)前記画像フレーム中の全てのDCTブロックに対して夫々の複数のビット平面(b,b+1)を含む圧縮されたビットストリームを形成し、前記圧縮されたビットストリーム中のデータはビット平面で配置される段階を更に含む、請求項2記載の方法。
  7. 前記段階(a)は、夫々のDCTブロックについての任意のDCT係数の最大の大きさ(NMAX)を決定する段階を更に有し、
    前記方法は、前記段階(b)の前に前記最大の大きさのうちの最大のもの(N)を決定する段階を更に有し、
    前記複数のビット平面からのデータは、前記最大の大きさのうちの最大のものに対応するビット平面から始まる圧縮されたビットストリーム中に配置される、
    請求項6記載の方法。
  8. 前記段階(a)及び前記段階(b)は、前記画像フレームについての全てのDCT残留係数の同時の記憶を必要とすることなく行われる、請求項6記載の方法。
  9. 前記複数のビット平面(b,b+1)は、最上位ビット平面(b)から最下位ビット平面(b+1)までの各ビット平面を含む、請求項1記載の方法。
  10. 前記変換ブロックは、離散コサイン変換、ブロックベースのウェーブレット符号化又はマッチング追跡、並びに、不連続な量子化ステップを用いたSNRスケーラビリティからなる群のうちの1つによって形成される、請求項1記載の方法。
  11. 画像フレームの個々の変換ブロックに対する複数の残留係数を分解する手段と、
    前記画像フレーム中の次の変換ブロックについての係数を分解する前に、夫々の変換ブロックについての夫々の複数のビット平面(b,b+1)又は不連続な量子化ステップを処理する走査及び符号化手段とを含む、
    ファイン・グラニュラ・スケーラビリティ(fine granular scalability)符号化用の装置。
  12. 前記走査及び符号化手段は、第1のシーケンス中のブロックを走査し前記第1のシーケンスとは異なる第2のシーケンス中に符号化されたデータを記憶する手段を含む、請求項11記載の装置。
  13. 前記変換ブロックは、離散コサイン変換(DCT)ブロックであり、残留係数はDCT残留係数であり、
    前記DCTブロックのうちのi番目のDCTブロックの各b番目のビット平面は、前記DCTブロックのうちのi−1番目のDCTブロックのb番目のビット平面の場所の直後の場所に記憶され、ただし、bは整数であり、iは1よりも大きい整数である、請求項12記載の装置。
  14. 前記装置は、前記画像フレームについての全てのDCT残留係数の同時記憶に用いられるメモリを有さない、請求項11記載の装置。
  15. 前記分解手段は、ブロックについての残留係数データを、中間記憶装置に前記残留係数データを記憶することなく前記走査及び符号化手段へ直接与える、請求項11記載の装置。
  16. 前記分解手段は、ブロックについての残留係数データを、前記画像フレーム中の全てのブロックから単一のビット平面(b)についてデータを抽出するために前記残留係数データをマスクすることなく前記走査及び符号化手段へ直接与える、請求項11記載の装置。
  17. 符号化されたコンピュータプログラムコードをその上に有するコンピュータ読み取り可能な媒体であって、前記コンピュータプログラムコードがプロセッサによって実行されると、前記プロセッサは、
    (a)画像フレーム中の各個々の変換ブロックに対して、
    (i)夫々の変換ブロックに対する夫々の複数の残留係数を分解する段階と、
    (ii)前記画像フレーム中の次の変換ブロックについての係数を分解する前に、夫々の変換ブロックについての夫々の複数のビット平面(b,b+1)又は不連続な量子化ステップを処理する段階と、
    を繰り返す段階を含む、ファイン・グラニュラ・スケーラビリティ(fine granular scalability)符号化の方法を実行する、コンピュータ読み取り可能な媒体。
  18. 前記変換ブロックは離散コサイン変換(DCT)ブロックであり、残留係数はDCT残留係数である、請求項17記載のコンピュータ読み取り可能な媒体。
  19. 前記段階(ii)は、前記複数のビット平面の夫々をランレングス及び可変長符号化することを含む、請求項18記載のコンピュータ読み取り可能な媒体。
  20. 前記段階(a)は、更に、夫々の異なる位置に各ビット平面を記憶する段階を有し、
    前記DCTブロックのうちのi番目のDCTブロックの各b番目のビット平面は、前記DCTブロックのうちのi−1番目のDCTブロックのb番目のビット平面の場所の直後の場所に記憶され、ただし、bは整数であり、iは1よりも大きい整数である、請求項18記載のコンピュータ読み取り可能な媒体。
JP2003568899A 2002-02-15 2003-02-05 メモリ−帯域幅が効率的なファイン・グラニュラ・スケーラビリティ(finegranularscalability:FGS)エンコーダ Withdrawn JP2005518163A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/076,374 US20030156637A1 (en) 2002-02-15 2002-02-15 Memory-bandwidth efficient FGS encoder
PCT/IB2003/000401 WO2003069917A1 (en) 2002-02-15 2003-02-05 Memory-bandwidth efficient fine granular scalability (fgs) encoder

Publications (1)

Publication Number Publication Date
JP2005518163A true JP2005518163A (ja) 2005-06-16

Family

ID=27732499

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003568899A Withdrawn JP2005518163A (ja) 2002-02-15 2003-02-05 メモリ−帯域幅が効率的なファイン・グラニュラ・スケーラビリティ(finegranularscalability:FGS)エンコーダ

Country Status (7)

Country Link
US (1) US20030156637A1 (ja)
EP (1) EP1479246A1 (ja)
JP (1) JP2005518163A (ja)
KR (1) KR20040083450A (ja)
CN (1) CN1633814A (ja)
AU (1) AU2003205962A1 (ja)
WO (1) WO2003069917A1 (ja)

Families Citing this family (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100556838B1 (ko) * 2002-09-17 2006-03-10 엘지전자 주식회사 미세단위 신축형 부호화 및 복호화 장치와 방법
CN1871858A (zh) * 2003-10-20 2006-11-29 三星电子株式会社 规格化视觉品质的比特率控制方法与装置
KR100565308B1 (ko) * 2003-11-24 2006-03-30 엘지전자 주식회사 에스엔알 스케일러빌리티를 위한 동영상 부호화 및 복호화 장치
EP1607858A1 (en) * 2004-06-16 2005-12-21 Koninklijke Philips Electronics N.V. Bit-plane extraction operation
KR100736104B1 (ko) * 2006-04-06 2007-07-06 삼성전자주식회사 독립적 파싱을 지원하는 비디오 코딩 방법 및 장치
WO2008007929A1 (en) * 2006-07-14 2008-01-17 Samsung Electronics Co., Ltd Method and apparatus for encoding and decoding video signal of fgs layer by reordering transform coefficients
CN101159686B (zh) * 2007-11-01 2010-04-14 北京航空航天大学 一种零延迟的基于滑动窗口的fgs带宽分配方法
WO2013016871A1 (en) * 2011-08-03 2013-02-07 Mediatek Inc. Method and video decoder for decoding scalable video stream using inter-layer racing scheme
GB2545503B (en) 2015-12-18 2020-04-08 Imagination Tech Ltd Lossy data compression
CN111556318A (zh) * 2020-04-24 2020-08-18 西安万像电子科技有限公司 数据传输方法及装置

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5442458A (en) * 1991-12-18 1995-08-15 Eastman Kodak Company Method and associated apparatus for encoding bitplanes for improved coding efficiency
GB9703441D0 (en) * 1997-02-19 1997-04-09 British Tech Group Progressive block-based coding for image compression
US6680976B1 (en) * 1997-07-28 2004-01-20 The Board Of Trustees Of The University Of Illinois Robust, reliable compression and packetization scheme for transmitting video
US6275531B1 (en) * 1998-07-23 2001-08-14 Optivision, Inc. Scalable video coding method and apparatus
US6263022B1 (en) * 1999-07-06 2001-07-17 Philips Electronics North America Corp. System and method for fine granular scalable video with selective quality enhancement
KR100796176B1 (ko) * 1999-08-27 2008-01-21 코닌클리케 필립스 일렉트로닉스 엔.브이. 신호 코딩 방법 및 장치, 인코더, 카메라 시스템, 디코딩 방법, 스케일가능 디코더 및 수신기
US6614936B1 (en) * 1999-12-03 2003-09-02 Microsoft Corporation System and method for robust video coding using progressive fine-granularity scalable (PFGS) coding
US6456744B1 (en) * 1999-12-30 2002-09-24 Quikcat.Com, Inc. Method and apparatus for video compression using sequential frame cellular automata transforms
KR100353851B1 (ko) * 2000-07-07 2002-09-28 한국전자통신연구원 파문 스캔 장치 및 그 방법과 그를 이용한 영상코딩/디코딩 장치 및 그 방법
AUPR192700A0 (en) * 2000-12-06 2001-01-04 Canon Kabushiki Kaisha Storing coding image data in storage of fixed memory size
US6798364B2 (en) * 2002-02-05 2004-09-28 Intel Corporation Method and apparatus for variable length coding

Also Published As

Publication number Publication date
EP1479246A1 (en) 2004-11-24
US20030156637A1 (en) 2003-08-21
CN1633814A (zh) 2005-06-29
KR20040083450A (ko) 2004-10-01
AU2003205962A1 (en) 2003-09-04
WO2003069917A1 (en) 2003-08-21

Similar Documents

Publication Publication Date Title
JP5619688B2 (ja) 二層符号化及び単層復号化による階層的ビデオ符号化
US6944222B2 (en) Efficiency FGST framework employing higher quality reference frames
US6697426B1 (en) Reduction of layer-decoding complexity by reordering the transmission of enhancement layer frames
US6788740B1 (en) System and method for encoding and decoding enhancement layer data using base layer quantization data
US20030095603A1 (en) Reduced-complexity video decoding using larger pixel-grid motion compensation
KR20020090239A (ko) 미세한 그레뉼라 스케일러빌리티 비디오 코딩에서확장층에 대한 개선된 예측 구조들
JP2008533850A5 (ja)
JP2011130410A (ja) 符号化方法、復号化方法及び装置
KR20040047977A (ko) 공간적으로 스케일가능한 압축
JPH07322269A (ja) ビデオデータを有するビットストリームを符号変換する方法および装置
WO1999027715A1 (en) Method and apparatus for compressing reference frames in an interframe video codec
KR20080066709A (ko) 다중 계층 비디오 인코딩
JP2005160084A (ja) SNR(signaltonoiseratio)スケーラビリティを実現するための動映像処理装置及びその方法
JP2005518163A (ja) メモリ−帯域幅が効率的なファイン・グラニュラ・スケーラビリティ(finegranularscalability:FGS)エンコーダ
US6944346B2 (en) Efficiency FGST framework employing higher quality reference frames
US8326060B2 (en) Video decoding method and video decoder based on motion-vector data and transform coefficients data
WO2006132509A1 (en) Multilayer-based video encoding method, decoding method, video encoder, and video decoder using smoothing prediction
US20050135478A1 (en) Reduction of layer-decoding complexity by reordering the transmission of enhancement layer frames
Koumaras et al. Principles of Digital Video Coding
JPH07203372A (ja) ビデオデータ配列方法並びにその符号化装置及び復号化装置
JP2002016927A (ja) 動画像符号化方法および動画像伝送方法
WO2008029346A2 (en) Video decoding

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060202

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20070809