JP2008526072A - スケーラブル符号化 - Google Patents

スケーラブル符号化 Download PDF

Info

Publication number
JP2008526072A
JP2008526072A JP2007547742A JP2007547742A JP2008526072A JP 2008526072 A JP2008526072 A JP 2008526072A JP 2007547742 A JP2007547742 A JP 2007547742A JP 2007547742 A JP2007547742 A JP 2007547742A JP 2008526072 A JP2008526072 A JP 2008526072A
Authority
JP
Japan
Prior art keywords
encoding
data
transform coefficients
transform
subset
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2007547742A
Other languages
English (en)
Inventor
イホル オー キレンコ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Koninklijke Philips NV
Original Assignee
Koninklijke Philips NV
Koninklijke Philips Electronics NV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Koninklijke Philips NV, Koninklijke Philips Electronics NV filed Critical Koninklijke Philips NV
Publication of JP2008526072A publication Critical patent/JP2008526072A/ja
Withdrawn legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/18Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a set of transform coefficients
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • H04N19/37Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability with arrangements for assigning different transmission priorities to video input data or to video coded data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/61Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding in combination with predictive coding

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

データをエンコードする方法は、前記データをデータのセットに分割するステップと、前記データのセットの各々を変換係数A、B及びCのセットへ変換するステップと、各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットS0、S1、…に割り当てるステップと、各前記サブセットを個別にエンコードするステップと、を有する。本方法は、各前記変換係数の大きさを、少なくとも1つの閾値T1、T2、…と比較するステップを更に有しても良い。各サブセットが選択された変換係数の全体の大きさを含むため、伝送の間の他のサブセットの損失が、これら変換係数に影響を与えない。本発明は特に、画像データをエンコードするために適している。

Description

本発明は、スケーラブル符号化に関する。更に詳細には、本発明は、少なくとも2層のエンコードされた情報を生成する、データをエンコードするための方法及び装置に関する。第1の層は、元のデータの比較的粗い(即ち低い解像度及び/又は低い品質)復元を可能とする基本的なエンコードされた情報を含み、少なくとも1つの第2の層は、前記第1の層と組み合わせて、元のデータの比較的細かい(即ち高い解像度及び/又は高い品質)復元を可能とする付加的なエンコードされた情報を含む。
スケーラブル符号化は、ビデオ符号化において広く利用されている。良く知られたMPEG規格においては、第1の層は「基本層」(BL)と呼ばれ、第2の層は「拡張層」(EL)と呼ばれる。いずれの層とも、画像データのブロックを変換し、次いで変換係数の結果のブロックを走査及び可変長エンコードによりエンコードすることにより生成され得る。「基本層」は一般に、「拡張層」のダウンサンプリングされたバージョンである。
複数の層を生成する代替の手法が利用されても良い。例えば、変換係数は所謂ビットプレーン(bit plane)に分割されても良く、ここで各ビットプレーンは、ブロックの各変換係数の1以上のビットを含む。ビットプレーンは、「基本層」及び1以上の「拡張層」のような、種々の層に割り当てられても良い。送信及び受信されるビットプレーンの数が、復元される画像の解像度を決定する。この種のスケーラビリティは、微細粒スケーラビリティ(Fine Grain Scalability、FGS)と呼ばれる。
米国特許US6501397(Philips社Radhaらによる)は、ビットプレーン・エンコーディングを含む、画像信号の圧縮及びエンコードの方法を開示している。2以上のビットプレーンを組み合わせることにより、符号化効率が改善され得る。米国特許US6501397の全体の内容は、ここで本明細書に組み込まれたものとする。
変換係数をビットプレーンに分割することは、各ビットプレーンが各変換係数についての部分的な情報しか含まないという欠点を持つ。幾つかのビットプレーンが伝送の間に失われると、失われたビットは変換係数の不正確な表現に帰着し、それ故歪んだ復元データ(画像データのような)に帰着する。単一のビットプレーンのみが受信される場合、該ビットプレーンに含まれる部分的な情報は一般に、有意な方法で元のデータを復元するためには不十分である。
本発明の目的は、先行技術のこれらの及び他の問題を克服し、伝送損失に対してより回復力が高く、且つ実装が容易である、データをエンコードするための方法及び装置を提供することにある。
従って、本発明は、データのセットをエンコードする方法であって、
前記データのセットの各々を変換係数のセットへ変換するステップと、
各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てるステップと、
各前記サブセットを個別にエンコードするステップと、
を有する方法を提供する。変換係数を、該変換係数の大きさに依存するサブセットに割り当てることにより、変換係数の種々のサブセットへの効率的な分割が達成され、一方で、種々のサブセットは種々のエンコード層を生成するために利用され得る。サブセットの数としては色々な値がとり得、2、3、4、5又はそれ以上のサブセットが利用されても良い。
各変換係数を単一のサブセットに割り当てることにより、(それぞれの閾値を超えサブセットを空にする変換係数がない場合を除いて)各サブセットは1以上の変換係数の全体の値(即ち全てのビット)を含む。結果として、伝送の後に受信された各サブセットは、幾つかの変換係数が完全に知られることを可能とし、元のデータの歪みを防ぐ。勿論、伝送の間のサブセットの損失は、幾つかの変換係数が失われることに帰着し得、復元されるデータの幾分かの歪みに導き得るが、ビットプレーン符号化とは対照的に、単一のサブセットの損失は、全ての変換係数の歪みには帰着しない。
各サブセットを個別にエンコードすることにより、即ち、変換係数をサブセット毎にエンコードすることにより、符号化は単純且つ効率的なものとなる。加えて、本発明は、1つの特定のサブセットが、最も重要な変換係数、即ち最大の大きさを持つ変換係数を含むという著しい利点を提供する。伝送チャネルの帯域幅が限られている場合、当該単一のサブセットを(好ましくは「基本層」として)伝送することは、元のデータの最適な近似に帰着する。
データが分割されていないストリームとして供給される場合、本方法は該データをデータのセットに分割する更なるステップを含んでも良いことは、理解されるであろう。
変換係数を、これら変換係数の大きさ(振幅)に基づいてサブセットに割り当てることは、種々の方法、例えばテーブル内のエントリが大きさ及び対応するサブセットを表すルックアップテーブルを利用することにより、実現されても良い。しかしながら、各変換係数の大きさを、少なくとも1つの閾値と比較し、該変換係数が割り当てられるサブセットを選択することが好ましい。
各セットの変換係数の大きさを少なくとも1つの閾値と比較することにより、それぞれの大きさによって変換係数を効率的にグループ化することが可能である。このとき、各変換係数は、該比較に依存して、変換係数のそれぞれのセットの単一のサブセットに割り当てられても良い。
好適な実施例は、各前記サブセットを個別にエンコードする前記ステップより前に、それぞれの前記閾値を、各前記変換係数から減算するステップを更に有する。このことは、変換係数の大きさを減少させ、より効率的なエンコードを可能とする。
単一の閾値が利用されて、変換係数の各セットを効率的に分割しても良いが、2以上の閾値が利用され、変換係数の各セットの複数のサブセットを生成することが好ましい。例えば、4個の閾値が利用され、5個のサブセットに帰着しても良い。閾値は均一に間隔をとられても良い(最大の変換係数値が10である場合、例えば2、4、6及び8)が、不均一に間隔をとられても良い(最大の変換係数値が10である場合、例えば3.6、4.9、6.4及び8.1)。
更なる実施例においては、例えば関連するサブセットにわたって変換係数を均一に分散させるために、閾値は動的に調節されても良い。斯かる実施例においては、受信側で正確な復元を可能とするため、閾値も伝送されることが好ましい。閾値が静的(即ち略一定である)実施例においては、閾値は伝送される必要はない。
本方法はまた、好ましくは変換係数の大きさを閾値と比較した後に、変換係数をスケーリングするステップを含む。代替として、閾値がスケーリングされても良い。
好適な実施例においては、本発明による方法は、各前記サブセットの前記エンコードされた変換係数を、エンコードされた変換係数の単一のストリームへと結合するステップを更に有する。有利にも、前記少なくとも1つの閾値は、前記エンコードされた変換係数と組み合わせられても良い。閾値の代わりに又は閾値に加えてルックアップテーブルが利用される場合においては、テーブル識別子がエンコードされた変換係数と組み合わせられても良い。このようにして、各ストリームが、変換係数と、それぞれのサブセットを識別及び/又は定義するデータとの両方を含む。
各サブセットをエンコードするステップは、有利にも、可変長符号化(VLC)を含んでも良く、変換するステップは、ディジタルコサイン変換(DCT)又はディジタルウェーブレット変換(DWT)を含んでも良い。
種々のタイプのデータが利用されても良いが、本発明の方法は、データが画像(静止画又は映像、及び/又は動画又はビデオ)データである場合に、特に有利である。
本発明は更に、データのセットをエンコードするためのコンピュータプログラムであって、
前記データのセットの各々を変換係数のセットへ変換するステップと、
各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てるステップと、
各前記サブセットを個別にエンコードするステップと、
を実行するためのコンピュータ実行可能な命令を有するコンピュータプログラムを提供する。
前記コンピュータプログラムは、付加的なコンピュータ実行可能な命令、例えば各セットの変換係数の大きさを少なくとも1つの閾値と比較するための命令を有しても良い。前記コンピュータプログラムの製品は、前記プログラムが保存されたCD又はDVDのような担体を有しても良い。代替として、前記コンピュータプログラムは、リモートのサーバに保存されても良く、又はインターネットを利用してダウンロードされても良い。
本発明はまた、データのセットをエンコードするためのエンコード装置であって、
前記データのセットの各々を変換係数のセットへ変換する変換手段と、
各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てる割り当て手段と、
各前記サブセットを個別にエンコードするエンコード手段と、
を有する装置を提供する。
本エンコード装置は更に、各セットの変換係数の大きさを少なくとも1つの閾値と比較するための比較手段、及び/又は動きベクトルを導出するための動き推定手段を有しても良い。
加えて、本発明は、データのセットをトランスコードするためのトランスコード装置であって、
前記データのセットをデコードするデコード手段と、
各変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てる割り当て手段と、
各前記サブセットを個別にエンコードするエンコード手段と、
を有する装置を提供する。
斯かるトランスコード装置は、従来の方法でエンコードされたデータのセットを、本発明によりエンコードされたデータのセットに変換するために利用され得る。該トランスコード装置は更に、各セットの変換係数の大きさを少なくとも1つの閾値と比較するための比較手段、及び/又はデータのセットを逆変換するように構成された逆変換手段、及びデータの各セットを変換係数のセットに変換する変換手段、及び/又はデコードされたデータのセットを逆量子化する逆量子化手段を有しても良い。動き補償手段が更に備えられても良い。
本発明は更に、以上に定義されたエンコード装置又は以上に定義されたトランスコード装置によりエンコードされたデータのセットをデコードするためのデコード装置であって、
前記データのサブセットをデコードするデコード手段と、
前記デコードされたデータのサブセットを変換係数のセットにグループ化するグループ化手段と、
前記変換係数のセットを逆変換する逆変換手段と、
を有する装置を提供する。
前記デコード装置は更に、変換係数のセットを逆走査するための逆走査手段、及び/又は動き補償を提供するための動き補償手段を有しても良い。
本発明は更に、以上に定義されたようなエンコード装置を有する、ビデオカメラのような携帯型消費者向け装置を提供する。本発明が提供し得る携帯型消費者向け装置の他の例は、ディジタル(スチル)カメラ、携帯(移動)電話、PDA(Personal Digital Assistant)及び携帯型テレビジョン装置である。
本発明は更に、以上に定義されたようなエンコード装置及び/又は以上に定義されたようなトランスコード装置及び/又は以上に定義されたようなデコード装置を有する、ビデオ伝送システムを提供する。
本明細書において開示されるアルゴリズム的な構成要素は実際には、ハードウェア(例えば特定用途向けICの一部)として、又は特殊用途向けディジタル信号プロセッサ若しくは汎用プロセッサ上で動作するソフトウェア等として、(全体又は一部が)実現されても良い。コンピュータプログラムとは、コマンドをプロセッサへと供給するための一連のロードステップ(中間言語及び最終的なプロセッサ言語への翻訳のような中間変換ステップを含んでも良い)の後に、(汎用又は特殊用途向けの)プロセッサが、 本発明の特徴的な機能のいずれかを実行することを可能とするコマンドの集合の、いずれかの物理的な実装として理解されるべきである。とりわけ、コンピュータプログラムは、例えばディスク又はテープのような担体上のデータ、メモリ中に存在するデータ、(有線又は無線の)ネットワーク接続によって伝送されるデータ、又は紙上のプログラムコードとして実装されても良い。プログラムコードの他に、該プログラムのために必要とされる特徴的なデータもまた、コンピュータプログラムとして実施化されても良い。本方法の動作のために必要とされるステップの幾つかは、データ入力及び出力ステップのように、コンピュータプログラム中に記述される代わりに、プロセッサの機能中に既に存在していても良い。
本発明は画像(又はビデオ)のエンコードに限定されるものではなく、例えばオーディオデータのような他のデータのエンコードのためにも利用され得ることは、留意されたい。
本発明は、添付図面に示された実施例を参照しながら、以下に更に説明される。
図1において単に限定的でない例として示された本発明のエンコード装置100は、入力信号VSを受信するための減算ユニット101を有する。本例においては、入力信号VSが、画像データのセットから成るビデオ信号であって、各セット(又はブロック)が8x8画素(画像要素)を表すビデオ信号であることが仮定される。しかしながら、本発明はビデオ信号に限定されるものではなく、本特定のデータ構造に限定されるものでもない。
減算ユニット101は、入力ビデオ信号VSから、動き予測された信号MCを減算するように構成される。結果の差分信号は変換ユニット102に供給され、変換ユニット102は画像データのセットを変換係数のセットへ変換する。画像データは一般に、本分野において良く知られた離散コサイン変換(DCT)を利用して変換されるが、例えば(ディジタル)ウェーブレット変換(DWT)のような、他の変換が利用されても良い。DCTに起因する変換係数は、(空間)周波数成分として解釈され得る。
走査(SCAN)ユニット103は、例えばMPEG準拠システムにおいて利用される「ジグザグ」順のような所定の順序で、変換係数の各セットを走査する。走査ユニット103は、変換ユニット102により出力された変換係数の2次元のセットを、1次元のセットへ変換する。走査ユニット103が変換ユニット102に組み込まれた実施例も考えられ、この場合には、変換ユニット102は変換係数の1次元のセットを出力する。
変換係数のセットはストリーム割り当て(SA)ユニット104に供給される。ストリーム割り当てユニット104は、各セットの個々の変換係数を1以上の閾値と比較し、次いで各変換係数を対応するサブセット又はストリームに割り当てる。本例においては、3個の閾値及び4個のサブセットがあり、各サブセットは1つのストリームに対応する(ストリームの数がサブセットの数よりも少ない、即ち少なくとも2つのサブセットが1つのストリームへと結合される実施例も考えられる)。閾値の比較は、図4を参照しながら後に更に説明される。
殆どの(サブセットの全てではない場合には)サブセットは、変換係数の最大の数よりも少ない変換係数を含む(例えば、8x8個の係数のブロックの場合のように最大の数が64個の場合に、10個)。各サブセット中の「空の」場所はゼロで埋められ、かくして標準的なサブセットのサイズを維持する。
ストリーム割り当てユニット104は、4つのデータストリームS0、S1、S2及びS3を生成し、各ストリームはデータのセットの変換係数のサブセットを含む。全てのデータストリームS0、S1、・・・は、エンコードユニット105の対応する部分VLC0、VLC1、・・・に供給される。エンコードユニット105の各部分は、適切なエンコード手法(本例においては可変長符号化(VLC))を利用して、それぞれのデータストリームを個別にエンコードし、出力データストリームを生成する。基本層ストリームBLは部分VLC0により生成され、拡張層ストリームEL1、EL2及びEL3は、それぞれ部分VLC1、VLC2及びVLC3により生成される。
典型的なエンコードユニットは、ルックアップテーブル(LUT)を利用して、符号語を生成する。エンコードユニット105の全ての部分VLC0乃至VLC3が同じ1つのルックアップテーブルを利用しても良いし、又は同一のそれぞれのルックアップテーブルを利用しても良いが、有利な実施例においては、符号化効率を改善するため、異なる部分は個別のルックアップテーブルを利用しても良い。可変長符号化(VLC)の代わりに、ランレングス符号化のような他のエンコード手法が利用されても良いことは、理解されるであろう。
図1の実施例において、「最も低い」データストリームS0は、逆変換ユニット106にも供給される。逆変換ユニット106は、本例においては、逆離散コサイン変換(IDCT)を実行する。結果の逆変換されたデータストリームは、加算器107を介して、一時的な保存(遅延)のためメモリ(MEM)108に供給される。遅延されたデータは、動き推定/動き補償(ME/MC)ユニット109に供給される。該ユニットは、当業者に良く知られた手法を利用して、動き予測された(動き補償)信号MC及び動きベクトルMVを生成する。動きベクトルMVは、エンコードユニット105の部分VLC0に供給され、動きベクトルが基本層ストリームBLに含められるようにする。
本発明の装置100は更に、データ低減のための量子化ユニット(図示されていない)を有しても良い。量子化ユニットは、変換ユニット102と走査ユニット103との間、又は走査ユニット103とストリーム割り当てユニット104との間に配置されても良い。量子化ユニットが存在する場合には、装置100は更に、量子化されたデータと元のデータとの間の不一致を推定するための逆量子化ユニットを有しても良い。量子化は損失の多いエンコードに帰着するため、幾分かの不一致が一般には存在する。
図1の装置100は、例えば良く知られたMPEG−2規格のような、MPEG(Motion Pictures Expert Group)規格に準拠するものであっても良い。
本発明によるトランスコーダが、図2において模式的に示される。トランスコーダ150は、先行技術によって単一層(非スケーラブルな)データストリームをデコードし、該デコードされたデータストリームを本発明によりエンコードするように構成される。図2のトランスコーダ150は、図1のエンコーダ100の全ての構成要素に加え、可変長デコード(VLD)ユニット110、逆量子化(IQ)ユニット111及び逆離散コサイン変換(IDCT)ユニット112を有する。
可変長デコード(VLD)ユニット110は、離散コサイン変換(DCT)を利用して従来の可変長エンコード、量子化及び変換を利用してエンコードされた、エンコードされた入力信号(符号化されたストリーム)CSを受信する。可変長デコード(VLD)ユニット110、逆量子化(IQ)ユニット111及び逆離散コサイン変換(IDCT)ユニット112は、該符号化されたストリームをビデオ信号(ビデオストリーム)VSに変換する。ビデオ信号VSは、図1のエンコード装置100におけるように、減算器101に供給される。動きベクトルMVは、可変長デコードユニット110により出力され、動き推定/動き補償(ME/MC)ユニット109及びエンコードユニット105に供給される。トランスコーダ150は、先行技術によりエンコードされた入力信号を受信し、本発明によりエンコードされた出力信号を生成することが可能であることが、かくして分かる。
信号(例えばビデオストリーム)をデコードするためのデコーダが、図3に示される。デコーダ200は、デコードユニット201、サブセットグループ化(SG)ユニット202、逆走査(ISCAN)ユニット203、逆離散コサイン変換(IDCT)ユニット204、加算器205及び動き補償(MC)ユニット206を有する。
デコードユニット201の各部分は、適切なデコード手法(本例においては可変長デコード(VLD))を利用してそれぞれのデータストリームを個別にデコードし、対応する出力データストリームを生成する。基本層ストリームBLは部分VLD0によりデコードされ、拡張層ストリームEL1、EL2及びEL3は、それぞれ部分VLD1、VLD2及びVLD3によりデコードされる。
デコードされたストリームはグループ化ユニット202に供給され、グループ化ユニット202は該ストリームを単一のストリームへグループ化する。本発明によれば、デコードユニット201の各部分VLD0、VLD1、・・・は、幾つかの完全な変換係数をデコードする。各部分によりデコードされた変換係数(典型的には64個)は、変換係数のセット全体のサブセットを形成する。グループ化ユニット202は、デコードユニット201の種々の部分から出力された変換係数をグループ化することにより、変換係数のセットを復元する。逆走査ユニット203は次いで逆走査を実行し、変換係数の各1次元のセットを2次元のセットに変換する。逆走査ユニット203は逆変換ユニット204に組み込まれても良いことは、理解されるであろう。
逆離散コサイン変換(IDCT)ユニット204は次いで逆離散コサイン変換を実行し、元の時間ドメインのデータを復元する。加算器205において、基本層デコードユニット部分VLD0が動き補償(MC)ユニット206に供給した動きベクトルMVに基づいて、動き補償が実行される。加算器205は、デコードされた出力ストリーム(復元された信号)RSを生成する。出力ストリームRSはまた、動き補償ユニット206にも供給される。
本発明の原理は、図4乃至6を参照して更に説明される。図4は、本発明によって、変換係数A、B及びCがどのようにサブセットに割り当てられるかを示す。変換係数A、B及びCは、図1の変換ユニット102により出力され得ることに留意されたい。
MPEG準拠の装置においては、8x8の(画像又はその他の)データのセット又は「ブロック」は、離散コサイン変換を利用して、8x8の変換係数のセット又は「ブロック」に変換される。斯かる変換係数のブロックは、図5及び6に模式的に示される。先行技術によるブロック400'においては、64個の変換係数のそれぞれが幾つかの部分に分割され、各部分は幾つかのビットの係数を含む。例えば変換係数457は、3つの最上位ビット(MSB)から成る第1の部分491、次の3ビットから成る第2の部分492、更なる3ビットから成る第3の部分493、及び2つの最下位ビット(LSB)から成る第4のビット494を有するものとして示される。このことはブロック400'の全ての変換係数について為されるため、該ブロックは部分491乃至494に対応する「スライス」に分割され、各スライスが各変換係数の数個(本例においては2又は3個)のビットを含む。次いで、これらスライスはエンコードされ、個別に送信される。受信側において、これら「スライス」は組み合わせられ、変換係数を復元する。
スライス中の多くの変換部分がゼロに等しくなるため、この既知の構成は比較的効率的なエンコードを可能とするが、欠点を持つ。最も重大な欠点は、伝送の間にスライスのいずれかが切断され又は損失されると、ブロックの全ての変換係数の幾つかのビットが失われるため、変換係数の正確な復元が不可能となるという事実である。
本発明は、変換係数のブロックを異なる態様で分割することにより、この問題を解決する。変換係数は、それぞれが構成部分へと分割されるのではなく、該変換係数の大きさ(振幅)に従って各ブロックの異なるサブセットに割り当てられる。このようにして、各サブセットは、それぞれの係数の完全な値(即ち全てのビット)を含む。しかしながら、各サブセットは、限られた数の係数の値のみを含む(全ての係数が略同じ値を持つ場合を除く。この場合、これら係数は全て同一のサブセットに割り当てられる)。結果として、各ブロックは依然として、スケーラブルなストリームを生成するために利用され得る幾つかのサブセットに分割され得、1つのサブセットの損失は一般に、全ての係数が悪影響を受けることに帰着しない。
本発明による8x8の変換係数のセット又は「ブロック」が、図6において模式的に示される。ブロック400もまた64個の係数により構成されるが、図5におけるように幾つかの部分又はスライスに分割はされない。その代わり、各係数は全体としてサブセットに割り当てられる。図6の例においては、セット400は2つのサブセットに分割される。係数401、402、409、419、421及び426は、第1のサブセットに割り当てられ(図6において点により示される)、係数457を含む残りの係数は第2のサブセットに割り当てられる。第1のサブセットは係数401、402、409、419、421及び426の全体の値を含み、第2のサブセットは残りの係数の全体の値を含むことが、明らかであろう。
図1における割り当てユニット104により実行されるような、変換係数をサブセットに割り当てるメカニズムは、ここで図4を参照しながら説明される。異なる大きさ(振幅)を持つ3つの変換係数の例A、B及びCが、閾値T1、T2及びT3と比較される。これら閾値はレベル又はサブセットを定義し、最も高い閾値T1は図1における、エンコードの後に基本層ストリームBLに帰着するストリームS0に対応する。ストリームS0、…、S3は、変換係数の各ブロックの対応するサブセットを含むことは理解されるであろう。
係数Aは閾値T1を超えているため、該係数はストリームS0に割り当てられる。係数Bは第1の閾値T1を超えておらず、それ故第2の閾値T2と比較される。該係数は第2の閾値T2を超えているため、係数Bは、エンコードの後に第1の拡張層EL1に帰着するストリームS1に割り当てられる。係数Cはいずれの閾値をも超えておらず、層EL3に帰着するストリームS3に割り当てられる。
かくして、係数が該係数の大きさに基づいてストリーム(又はサブセット)に割り当てられることが分かる。図4の例においては、最も大きい大きさ(即ち最も高い閾値T1を超える)係数が、基本層BLとしてエンコードされるサブセットに割り当てられる。このことは、最も大きな相対的「重み」を持つ(即ちデコードの後に復元されたデータに対して最も大きな寄与を持つ)変換係数が基本層においてエンコードされ、残りの小さな係数が拡張層においてエンコードされるという利点を持つ。従って、拡張層が伝送の間に失われても、デコードされた復元されたデータに対する影響は限られる。
閾値の数は本発明に対して本質的なものではなく、1、2、3、4、5又はそれ以上の閾値が利用されても良いことは理解されるであろう。閾値は静的なもの(例えば予め決定されたもの)であっても良いし、又は動的なもの(例えば調節可能なもの)であっても良い。係数がサブセットにわたって分散される範囲に応じて閾値が動的に調節される実施例も考えられる。例えば、サブセットにわたる略一様な係数の分散が、閾値を適切に調節することにより提供され得る。閾値は、セット中の最大の変換係数の大きさに対して特定の値を持つように調節されても良い。また閾値は、人間の眼の特性に基づくものであっても良い。静的でない閾値は伝送され、基本層BLに帰着するストリームS0に含められても良い。
本発明は、変換係数を構成部分に分割すること、及びこれら(エンコードされた)部分を個別に伝送することが、伝送誤りに対する脆弱性を増大させるという洞察に基づくものである。本発明は、変換係数の大きさに基づいて変換係数のセットのサブセットを生成し、(エンコードされた)係数の全体の値を伝送することが、画像データのようなスケーラブルなデータに対して有効な伝送メカニズムであるという洞察から利益を得るものである。
本明細書において利用されるいずれの用語も、本発明の範囲を限定するものとして解釈されるべきではない。特に、「有する(comprise及びcomprising)」なる語は、明確に言及されていないいずれの要素をも除外することを意図するものではない。単一の(回路)要素は、複数の(回路)要素又はその同等物により代用されても良い。
本発明はビデオ(画像)データを参照しながら説明されたが、本発明はかように限定されるものではなく、オーディオデータをエンコードするためにも利用され得る。
それ故、本発明は以上に説明された実施例に限定されるものではなく、添付する請求項において定義された本発明の範囲から逸脱することなく多くの変更及び付加が為され得ることは、当業者には理解されるであろう。
本発明によるエンコード装置を模式的に示す。 本発明によるトランスコード装置を模式的に示す。 本発明によるデコード装置を模式的に示す。 本発明による、変換係数のデータサブセットへの割り当てを模式的に示す。 先行技術による変換係数のセットを模式的に示す。 本発明による変換係数のセットを模式的に示す。

Claims (18)

  1. データのセットをエンコードする方法であって、
    前記データのセットの各々を変換係数のセットへ変換するステップと、
    各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てるステップと、
    各前記サブセットを個別にエンコードするステップと、
    を有する方法。
  2. 各前記変換係数の大きさを、前記変換係数が割り当てられるサブセットを選択するために、少なくとも1つの閾値と比較するステップを更に有する、請求項1に記載の方法。
  3. 各前記サブセットを個別にエンコードする前記ステップより前に、それぞれの前記閾値を、各前記変換係数から減算するステップを更に有する、請求項2に記載の方法。
  4. 例えば前記変換係数を関連するサブセットにわたって一様に分散させるために、前記少なくとも1つの閾値を動的に調節するステップを更に有する、請求項2に記載の方法。
  5. 各前記サブセットの前記エンコードされた変換係数を、エンコードされた変換係数の単一のストリームへと結合するステップを更に有する、請求項1に記載の方法。
  6. 前記少なくとも1つの閾値は、前記エンコードされた変換係数と組み合わせられる、請求項2又は5に記載の方法。
  7. 各前記サブセットをエンコードする前記ステップは、可変長符号化又はランレングス符号化を含む、請求項1に記載の方法。
  8. 前記変換するステップは、ディジタルコサイン変換又はディジタルウェーブレット変換を含む、請求項1に記載の方法。
  9. 前記データは画像データである、請求項1に記載の方法。
  10. データのセットをエンコードするためのコンピュータプログラムであって、
    前記データのセットの各々を変換係数のセットへ変換するステップと、
    各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てるステップと、
    各前記サブセットを個別にエンコードするステップと、
    を実行するためのコンピュータ実行可能な命令を有するコンピュータプログラム。
  11. データのセットをエンコードするためのエンコード装置であって、
    前記データのセットの各々を変換係数のセットへ変換する変換手段と、
    各前記変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てる割り当て手段と、
    各前記サブセットを個別にエンコードするエンコード手段と、
    を有する装置。
  12. 動きベクトルを導出するための動き推定手段を更に有する、請求項11に記載の装置。
  13. データのセットをトランスコードするためのトランスコード装置であって、
    前記データのセットをデコードするデコード手段と、
    各変換係数を、前記変換係数の大きさに依存して、それぞれの前記変換係数のセットの単一のサブセットに割り当てる割り当て手段と、
    各前記サブセットを個別にエンコードするエンコード手段と、
    を有する装置。
  14. 前記デコードされたデータのセットを逆量子化する逆量子化手段を更に有する、請求項13に記載の装置。
  15. 請求項11に記載のエンコード装置又は請求項13に記載のトランスコード装置によりエンコードされたデータのセットをデコードするためのデコード装置であって、
    前記データのサブセットをデコードするデコード手段と、
    前記デコードされたデータのサブセットを変換係数のセットにグループ化するグループ化手段と、
    前記変換係数のセットを逆変換する逆変換手段と、
    を有する装置。
  16. 動き補償手段を更に有する、請求項15に記載の装置。
  17. 請求項11に記載のエンコード手段を有する、ビデオカメラのような携帯型消費者向け装置。
  18. 請求項11に記載のエンコード装置及び/又は請求項13に記載のトランスコード装置及び/又は請求項15に記載のデコード装置を有するビデオ伝送システム。
JP2007547742A 2004-12-22 2005-12-16 スケーラブル符号化 Withdrawn JP2008526072A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP04106895 2004-12-22
PCT/IB2005/054280 WO2006067712A1 (en) 2004-12-22 2005-12-16 Scalable coding

Publications (1)

Publication Number Publication Date
JP2008526072A true JP2008526072A (ja) 2008-07-17

Family

ID=36123419

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2007547742A Withdrawn JP2008526072A (ja) 2004-12-22 2005-12-16 スケーラブル符号化

Country Status (7)

Country Link
US (1) US20090274381A1 (ja)
JP (1) JP2008526072A (ja)
KR (1) KR20070090254A (ja)
CN (1) CN101088295A (ja)
BR (1) BRPI0519163A2 (ja)
RU (1) RU2007128067A (ja)
WO (1) WO2006067712A1 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8565314B2 (en) 2006-10-12 2013-10-22 Qualcomm Incorporated Variable length coding table selection based on block type statistics for refinement coefficient coding
US8325819B2 (en) 2006-10-12 2012-12-04 Qualcomm Incorporated Variable length coding table selection based on video block type for refinement coefficient coding
US8599926B2 (en) 2006-10-12 2013-12-03 Qualcomm Incorporated Combined run-length coding of refinement and significant coefficients in scalable video coding enhancement layers
US9319700B2 (en) 2006-10-12 2016-04-19 Qualcomm Incorporated Refinement coefficient coding based on history of corresponding transform coefficient values
EP2875641B1 (en) * 2012-06-29 2018-07-25 Intel Corporation Systems, methods, and computer program products for scalable video coding based on coefficient sampling
US8988574B2 (en) 2012-12-27 2015-03-24 Panasonic Intellectual Property Corporation Of America Information communication method for obtaining information using bright line image
US8922666B2 (en) 2012-12-27 2014-12-30 Panasonic Intellectual Property Corporation Of America Information communication method
WO2014103157A1 (ja) 2012-12-27 2014-07-03 パナソニック株式会社 映像表示方法
US10530486B2 (en) 2012-12-27 2020-01-07 Panasonic Intellectual Property Corporation Of America Transmitting method, transmitting apparatus, and program
CN104885381B (zh) 2012-12-27 2017-12-19 松下电器(美国)知识产权公司 信息通信方法
US9608725B2 (en) 2012-12-27 2017-03-28 Panasonic Intellectual Property Corporation Of America Information processing program, reception program, and information processing apparatus
SG11201400255RA (en) * 2012-12-27 2014-10-30 Panasonic Ip Corp America Information communication method
US9088360B2 (en) 2012-12-27 2015-07-21 Panasonic Intellectual Property Corporation Of America Information communication method
US9608727B2 (en) 2012-12-27 2017-03-28 Panasonic Intellectual Property Corporation Of America Switched pixel visible light transmitting method, apparatus and program
EP2940901B1 (en) 2012-12-27 2019-08-07 Panasonic Intellectual Property Corporation of America Display method
US10523876B2 (en) 2012-12-27 2019-12-31 Panasonic Intellectual Property Corporation Of America Information communication method
US9560284B2 (en) 2012-12-27 2017-01-31 Panasonic Intellectual Property Corporation Of America Information communication method for obtaining information specified by striped pattern of bright lines
US9087349B2 (en) 2012-12-27 2015-07-21 Panasonic Intellectual Property Corporation Of America Information communication method
SG11201505027UA (en) 2012-12-27 2015-07-30 Panasonic Ip Corp America Information communication method
US10951310B2 (en) 2012-12-27 2021-03-16 Panasonic Intellectual Property Corporation Of America Communication method, communication device, and transmitter
US10303945B2 (en) 2012-12-27 2019-05-28 Panasonic Intellectual Property Corporation Of America Display method and display apparatus
GB2518823A (en) * 2013-09-25 2015-04-08 Sony Corp Data encoding and decoding
US10516898B2 (en) 2013-10-10 2019-12-24 Intel Corporation Systems, methods, and computer program products for scalable video coding based on coefficient sampling
US9762912B2 (en) 2015-01-16 2017-09-12 Microsoft Technology Licensing, Llc Gradual updating using transform coefficients for encoding and decoding
CN109874020B (zh) * 2019-01-17 2021-03-30 辽宁师范大学 质量和复杂度可分级的不可分离提升小波变换方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3170193B2 (ja) * 1995-03-16 2001-05-28 松下電器産業株式会社 画像信号の符号化装置及び復号装置
US7082221B1 (en) * 2000-09-29 2006-07-25 Intel Corporation Bandwidth determination for multiple layer digital video
US20030202599A1 (en) * 2002-04-29 2003-10-30 Koninklijke Philips Electronics N.V. Scalable wavelet based coding using motion compensated temporal filtering based on multiple reference frames

Also Published As

Publication number Publication date
BRPI0519163A2 (pt) 2008-12-30
WO2006067712A1 (en) 2006-06-29
CN101088295A (zh) 2007-12-12
RU2007128067A (ru) 2009-01-27
US20090274381A1 (en) 2009-11-05
KR20070090254A (ko) 2007-09-05

Similar Documents

Publication Publication Date Title
JP2008526072A (ja) スケーラブル符号化
EP1529401B1 (en) System and method for rate-distortion optimized data partitioning for video coding using backward adaptation
JP3888597B2 (ja) 動き補償符号化装置、及び動き補償符号化復号化方法
RU2313190C2 (ru) Способ и устройство для генерации масштабируемого кодированного видеосигнала из немасштабируемого кодированного видеосигнала
JP2661985B2 (ja) ディジタルビデオ信号符号化装置とそれに対応する復号装置
US20070189626A1 (en) Video encoding/decoding method and apparatus
US20030043908A1 (en) Bandwidth scalable video transcoder
US20090238264A1 (en) System and method for real-time transcoding of digital video for fine granular scalability
JP2004504781A (ja) 複数のエンコーダを備えるデータ符号化装置
US20070177664A1 (en) Entropy encoding/decoding method and apparatus
US20030016878A1 (en) Dynamic image compression coding apparatus
JP5021167B2 (ja) 複数記述符号化のための装置及び方法
US11475600B2 (en) Method and device for digital data compression
KR20050012782A (ko) 코딩 중에 이미지 선명도를 최적화하기 위한 방법과 시스템
JP2007522742A (ja) 非線形量子化に基づくビデオ画像の符号化及び復号化
JP2006191253A (ja) レート変換方法及びレート変換装置
KR100813258B1 (ko) 화상 데이터 부호화 및 복호화 장치 및 방법
JP2008271039A (ja) 画像符号化装置及び画像復号化装置
Chu On lossless and lossy compression of step size matrices in JPEG coding
KR20080004855A (ko) 문맥 기반 적응적 가변 길이 부호화 인코더 및 디코더,문맥 기반 적응성 가변 길이 부호화하는 방법과 복호화하는방법 및 이를 이용한 동영상 전송 시스템.
Celik et al. Gray-level-embedded lossless image compression
JP2018082299A (ja) 映像符号化装置、映像復号装置、及びプログラム
JP2003535496A (ja) 画像シーケンスを符号化する方法または復号する方法および装置
KR20060027831A (ko) 신호를 비트 스트림으로 인코딩하는 방법
US20090074059A1 (en) Encoding method and device for image data

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20090303