JP4215269B2 - 領域ベースのスケーラブルな画像コーディング - Google Patents

領域ベースのスケーラブルな画像コーディング Download PDF

Info

Publication number
JP4215269B2
JP4215269B2 JP2000560732A JP2000560732A JP4215269B2 JP 4215269 B2 JP4215269 B2 JP 4215269B2 JP 2000560732 A JP2000560732 A JP 2000560732A JP 2000560732 A JP2000560732 A JP 2000560732A JP 4215269 B2 JP4215269 B2 JP 4215269B2
Authority
JP
Japan
Prior art keywords
resolution
region
data
image
mask
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000560732A
Other languages
English (en)
Other versions
JP2002521880A5 (ja
JP2002521880A (ja
Inventor
ワン メン
ドン ヤン クー
クー リー
サイモン ブレント
Original Assignee
ディーエーシー インターナショナル インク.
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ディーエーシー インターナショナル インク. filed Critical ディーエーシー インターナショナル インク.
Publication of JP2002521880A publication Critical patent/JP2002521880A/ja
Publication of JP2002521880A5 publication Critical patent/JP2002521880A5/ja
Application granted granted Critical
Publication of JP4215269B2 publication Critical patent/JP4215269B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/127Prioritisation of hardware or computational resources
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/129Scanning of coding units, e.g. zig-zag scan of transform coefficients or flexible macroblock ordering [FMO]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Processing (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は一般的に画像コーディングに関し、特に、スケーラブルで、コンテントベースであり、ランダムにアクセス可能なデジタル静止画像を圧縮させたり伸長させたりすることに関する。
【0002】
【従来の技術】
インターネットとデジタルマルチメディアアプリケーションが急速に発展した結果、通常莫大で処理しにくい生の画像データファイルを圧縮形式にする新たな画像コーディングツールが強く要求されるようになってきた。しかしながら、圧縮処理後のビットストリームのコンパクト性だけが開発者が新たなコーディングツールを考案する際に要求されるわけではではない。エンドユーザとアプリケーションは、スケーラビリティ、エラー対応性やコンテントベースのアクセス可能性などの特徴をより要求するようになってきている。
【0003】
写真や映画は人間の目に映る3次元の物体を2次元に投影したものである。2次元の物体を記録する方法は「連続的」もしくは「アナログ的」再生である。デジタル画像は、これらのアナログ画像を非連続的に表したものであり、こうしたアナログ画像は様々な色や明暗度を表すドットや写真要素(ピクセル)の並び方によって構成される。コンピュータモニターやテレビモニターにおいて、デジタル画像はガラススクリーンに投影されたピクセルによって表現され、その画像をオペレーターが見る。ある特定の画像を描写するピクセル数を解像度という。例えば、ある一つの物体を描写するのに使うピクセル数が多くなるにつれて解像度は高くなる。
【0004】
中位解像度のモノクロ画像(白黒画像は"グレースケール"という)は横列640ピクセルからなる。通常の画像は、横に480ピクセル、縦に640ピクセルの列を含む。従って、ピクセル640×480一画像には合計307,200ピクセルが表示される。モノクロ画像の各ピクセルを描写するのに1バイトを必要とすると(黒、白両方の場合において)、単に黒や白の画像を描写するのに合計307,200バイトが必要となる。中度のグレースケール画像は暗度を描写するのに異なるレベルの解像度を使うため、8ビットもしくはグレー256レベルを使う。従って、結果として生じる画像ファイルはより膨大となる。
【0005】
カラー画像において、一画像における各ピクセルのカラーは典型的には3つの変数(赤(R)、緑(G)と青(B))によって決定される。これら3変数を様々な割合で混ぜると、様々なカラーのスペクトルをコンピュータに表示することができる。この3カラーの1カラーを表す際のバラエティが増えれば増えるほどより多くのカラーを表示することができる。例えば、明暗度256の赤を表現するために8ビット数が必要となる。つまり、このカラーの値範囲は0−255ということになる。従って、1ピクセルを表示する際必要なビットの合計は24ビットとなる(赤、緑、青各8ビットの形式、これは一般にRGB888形式という)。従って、RGBピクチャーは赤、緑と青の3階層を有し、このピクチャーにおける各ピクセルのカラー範囲は0−16.78、すなわち、R×G×B=256×256×256である。従って、640×480ピクセルのスタンダードカラー画像は、約7.4メガビットのデータが記憶・表示されるコンピュータシステムを必要とする。この数字は、縦解像度、横解像度と全カラー範囲を表現するために必要なビット数を掛けることによって求められる(640×480×24=7,372,800ビット)。
【0006】
一般的に手に入る標準ハードウェアは、速度も早く、予算的にも入手しやすくなっているが、この大きさのファイルを検索する際には速度が遅くなり扱いにくくなる。この問題は、特に、対話方式のアプリケーションとインターネット使用の際に顕著である。対話方式のアプリケーションでは、マルチメディアのデータを非常に早い速度で多面的に処理することが要求される。カラー画像ファイルは、常に膨大な大きさであることから、現実的で対話形式のコンピュータアプリケーションを開発する際に速度が遅くなる要因となっている。インターネットの場合、エンドユーザとアプリケーションは、速度が遅いモデムその他送信メディアによってさらに速度が遅くなってしまう。例えば、現在1秒間に電話線上に伝達される情報量は33,600ビット毎秒である。これは通常の電話会社で使用される実際のワイヤーと交換機能によっておこる。従って、7,372,800ビットのデータをもつ、シングル、全色RGB888 640×480ピクセルのページの場合、このボーレートで転送するのにおよそ3分半を要するであろう。
【0007】
画像データを圧縮する方法は多く存在し、また当業者によく知られている。これらの方法のいくつかは「ロスレス(損失のない)」圧縮として知られている。つまり、こうした方法は、データをデコーディング・伸長する際、そのオリジナルデータを損失・紛失せずに復元する。しかし、これらデータの縮小率が比較的小さいので、こうしたロスレス技術は画像圧縮技術に対して存在する需要の全てを満たすことができない。一方、転換不可能で、「ロッシィ(損失のある)」とよばれる圧縮方法がその他に存在する。こうした転換不可能の方法では莫大な圧縮が可能であるが、データの損失が生じる。画像ファイルでは、実際、画像のある局面を除去することによって高度の圧縮率が得られる。通常、この局面は人間の目では感受し、見ることができない。コーディングの後、逆の工程が縮小データに働き、オリジナル画像の適当な複写が伸長、復元される。さらに、ロッシイ圧縮技術は、データ圧縮や画像迫真性を多様に混在させるためにロスレス方法と組み合わせて使うこともできる。
【0008】
圧縮したビットストリームの密集度を測定するには、圧縮前の画像データの大きさに対するストリームの大きさが通常使われる。密集度を量的に表すためには圧縮率またはビット率が使われる。
圧縮率=(オリジナル画像のバイトの合計)/(圧縮画像に必要なバイトの合計)
及び
ビット率=(伸長に必要なバイトの合計)/(オリジナル画像のピクセル数)
【0009】
一般に、圧縮率が高くなるほど(あるいはビット率が低くなるほど)、圧縮されたビットストリームの密集度は高くなる。密集度の問題はデータ圧縮技術において常に主要な問題であった。
【0010】
圧縮画像ファイルの最も普及した形式の1つとしてGIF形式がある。GIFは「グラフィック画像形式」の省略で、コンプサーブ社によって開発された。GIFは、顧客がダイヤルアップで相手に画像を送信し、この際別のコンピュータハードウェアプラットフォームを使用している相手でも画像を送信できる方法を提供した。これは比較的古い形式であり、256色のパレット(24ビットカラーに対し8ビットのもの)を処理するよう設計されたものである。GIFが開発された際、これはまさに個人使用コンピュータの最先端をいくものであった。
【0011】
このGIF形式は色値を判別するのに8ビットカラールックアップテーブル(CLUTとも呼ばれる)を使用する。オリジナル画像が8ビット、グレースケール写真の場合、GIF形式は圧縮されたロスレス画像ファイルを生み出す。グレースケール画像は通常グレー256レベルしか持たない。圧縮を行うためには、GIFファイルを保存しながら情報を圧縮する、「ランレンクスエンコーディング(RLE)」機能を使用する。もしオリジナルファイルが24ビットカラーのグラフィック画像であるとしたら、これはまず8ビットCLUTにマップ化され、その後RLEを使って圧縮される。この場合の損失はオリジナルの24ビット(1千670万)カラーを8ビット(256カラー)CLUTに再マップ化する際に生じる。そして、RLEエンコーディングは再マップ化された8ビット画像と同様の、しかし同一ではない圧縮前の画像を再現する。RLEは、ピクセル線における彩色の変化が多い場合、画像を圧縮する方法としては非効率的である。同一色のピクセル列がある場合、もしくは非常に少ない色数が使用される場合にこのRLEは効率的な方法となる。
【0012】
他の静止イメージ形式のデファクトスタンダードとして、JPEGフォーマットがある。なお、JPEGとはJoint Photographic Experts Groupを表す。ここで、JPEGは、最終ファイルを作成するために損失(不可逆)圧縮方法を使う。このJPEGファイルは、GIF関連のファイルよりもさらに圧縮可能であり、GIFフォーマットで使用される8ビットテーブルよりも深みのある色を維持することができる。また、たいていのJPEG圧縮ソフトウェアは、ユーザにイメージ品質と圧縮量との選択肢を提供する。ここで、圧縮比率10:1においては、たいていのイメージがオリジナルとほとんど同じであり高品質のフルカラー表示を維持することができる。また、圧縮比率100:1においては、濃淡にむらのでる人為構造が入りやすくなる傾向があり、この人為構造は実質上の品質を減退させる。さらに、JEPGはイメージ圧縮においてRLEだけを使用するGIFと異なり、最終ファイルを作成するために革新的なツールのセットを使用する。
【0013】
まず、JPEGはイメージの輝度とクロミナンスに基づいて、オリジナカラースペースから正常化されたカラースペース(不可逆プロセス)へとイメージを変化させる。なお、輝度は明度に関する情報に対応し、クロミナンスは色合いに関する情報に対応する。ここで、人間の目は、色或いは色相の変化よりも明度の変化にいっそう敏感であるというテスト結果がある。このデータは、8×8ピクセルブロックによってレコードされる。この8×8ピクセルブロックはディスクリート・コサイン・トランスフォーム(DCT)を使用しているが、これも若干のイメージの損失を引き起こす。これらディスクリートエリア内で効率良くイメージを再試行し、目的のファイルを作成するために、(コーディングスキームだけでなく)標準的なRLEコーディングを使用する。なお、コーディング比率が高いとそれだけ多くのイメージの損失につながり、人為構造の8×8ピクセルはさらに目立つようになる。
【0014】
技術進歩における必要条件の1つとして、技術が拡大縮小可能性の特徴/特質を有するということがあげられる。拡大縮小可能性は、圧縮されたビットストリームが最終送信端末において部分的に解読及び利用されることができる程度を測定する。この革新的プロセスの必要性を満たすにあたり、拡大縮小可能性がデジタルイメージコーディング技術における新段階のための基本的な必要条件になった。一般に、拡大縮小可能性のピクセル精度及び空間解像度に関しては、静止イメージ圧縮のための基本的な2つの必要条件である。
【0015】
イメージへの忠実度を保証すると共に拡大縮小可能性を達成するため、近年のイメージ圧縮技術の開発に"ウェーブレット"に基づくマルチリゾリューションデコンポジションが組み込まれた。ウェーブレットは数学的機能であり、第二次世界大戦後に初めて広くアカデミックなアプリケーションとして考究された。ウェーブレットという名前は、基本原理(基礎関数)――或いは"マザーウェーブレット"は通常ゼロへ調整し、そのためにx軸について"ウェーブ"するという事実に由来する。ウェーブレットが正規直交或いは対称であるのと同様に、他の特徴は直或いは逆ウェーブレット変換の速く簡単な演算を確実にする。例えば、解読においては特に役立つ。
【0016】
ウェーブレットベース変換における他の重要な利点として、ウェーブレットによって多種のシグナル或いはイメージがコンパクトに表示されるということがある。例えば、不連続のイメージや鮮明なスパイクイメージは、通常サイン或いはコサインが同じ精度を成し遂げるために置いた関数の基礎より少ないウェーブレット基礎関数をとる。すなわち、ウェーブレットベースの方法は、より高いイメージ圧縮比率を達成できる可能性を持つことを意味する。同精度において、ウェーブレット係数から再構築されるイメージはフーリエ(サイン或いはコサイン)変換を使って得られたイメージよりも精度が高い。すなわち、ウェーブレットシームは、人間の視覚システムがより対応し易いイメージを作成することができる。
【0017】
ウェーブレットは、イメージをオリジナルの粗雑で低解像度のバージョンへ変換する。また、イメージに緻密な詳細を加える一連のエンハンスメント(Enhancement)へと変換する。このマルチリゾリューション特性は、拡大縮小可能性及びグレースフル・デグラデーションを必要とするネットワークによって結ばれたアプリケーションに適する。例えば、混成ネットワークは28.8モデム接続と中間のすべてだけでなく、非常に高帯域な部分を含むことがある。そこで、同じビデオ信号をネットワーク全域へ送信し、緻密な詳細を落とした低解像度イメージを低帯域ネットワーク部分へ送信することが適切である。ウェーブレットは、ネットワーク全域へ広がる高プライオリティパケット内の粗雑で低解像度イメージをラップすることによってこのアプリケーションに適する。低プライオリティパケットに属するエンハンスメントは、低帯域ネットワーク部分内で落とされるのが好ましい。
【0018】
このコード化されたイメージのマルチリゾリューション特性は、無線ネットワーク或いは低効率ネットワークのようなノイズが多い通信チャンネル内のグレースフル・デグラデーションをサポートする。また、低解像度ベースイメージを包含する高プライオリティパケットは、エラーが起こりエンハンスメント(Enhancement)が放棄される間に再転送される。
【0019】
内容ベースコーディング及びアクセスビリティー(Accessibility)は、イメージ圧縮領域における新しい特質である。しかしながら、イメージの特定領域を指定して操作する機能は、JPEGのような以前に発表されたコーディングテクニックではサポートされてない。同様に、内容ベースランダムアクセスビリティーは新ウェーブレットベーステクノロジーにおいて必要とされる機能でもない。この特徴を必要とするエンドユーザーアプリケーションは、マルチメディアデータベース問合わせ、インターネットサーバークライアント対話、イメージ内容作成及び編集、遠隔医学診断、そして対話型娯楽、等である。
【0020】
マルチメディアデータベースへの内容ベース問合せは、メカニズムのサポートを必要とする。このメカニズムは、目的とする対象物が存在するイメージ材料の位置を示す機能を有する。インターネット或いはローカルディスクサイトへの内容ベースハイパーリンクは、イメージ内で望ましいオブジェクトを作成する。このイメージは、インフォメーションナビゲーションへのエントリーポイントとして供給される。内容ベースエディットは、オブジェクト指向或いは領域ベースの方法内で、コンテンツプロデューサーにイメージ材料特質を操作させることを可能にする。内容ベース対話は、デジタルコンテンツ加入者或いは遠隔地の研究者がそれぞれの領域や嗜好に基づくイメージ情報の伝達をコントロールすることを可能にする。つまり、この内容ベースアクセスビリティは、語義上意味をなす視覚オブジェクトにイメージデータ表現、説明、扱い、又は検索の基盤として使われる。
【0021】
【発明が解決しようとする課題及び手段】
本発明の目的は、画像圧縮において領域ベースのコーディングを提供することである。本発明の観点によれば、スケーラブルでコンテントへのアクセスが可能な圧縮ビットストリームを作成するための、デジタル静止画像をエンコーディングおよびデコーディングする領域ベースの方法であって、生画像データを分解し、多重解像度サブイメージの階層に順序付ける工程と、処理対象領域を決定する工程と、処理対象領域を認識するため、領域マスクを定義する工程と、処理対象領域用に領域マスクをエンコーディングする工程と、解像度の後続レベル用に領域マスクを決定する工程と、多重解像度係数の大きさに基づいて領域データをスキャンし、プログレッシブにソートする工程とを有する方法が提供される。
【0022】
本発明の異なる他の観点によれば、スケーラブルでコンテントへのアクセスが可能な圧縮ビットストリームを作成するための、デジタル静止画像をエンコーディングおよびデコーディングする領域ベースの装置であって、生画像データを分解し、多重解像度サブイメージの階層内に順序付ける手段と、処理対象領域を決定する手段と、処理対象領域を認識するため、領域マスクを定義する手段と、処理対象領域用に領域マスクをエンコーディングする手段と、解像度の後続レベル用に領域マスクを決定する手段と、多重解像度係数の大きさに基づいて領域データをスキャンし、プログレッシブにソートする手段とを有する装置が提供される。
【0023】
本発明のさらに異なる別の観点によれば、スケーラブルでコンテントへのアクセスが可能な圧縮ビットストリームを作成するための、デジタル静止画像をエンコーディングおよびデコーディングする領域ベースのシステムであって、生画像データを分解し、多重解像度サブイメージの階層内に順序付ける工程と、処理対象領域を決定する工程と、処理対象領域を認識するため、領域マスクを定義する工程と、処理対象領域用に領域マスクをエンコーディングする工程と、解像度の後続レベル用に領域マスクを決定する工程と、多重解像度係数の大きさに基づいて領域データをスキャンし、プログレッシブにソートする工程とを有するシステムが提供される。
【0024】
【発明の実施の形態】
図1は、画像データ圧縮のための方法およびシステムの全体的なアーキテクチャを示す。本発明の好適な実施形態では、生の画像データがビットマップ画像システムに入力されると、このデータは本発明のシステムを通過して圧縮ビットストリームとしてこのシステムを出る。
【0025】
圧縮エンコーディング処理における第1のステップは、生データを多重解像度分解階層(略称MDH)へ変換または分解することである。本発明の好適な実施形態では、この分解を行なうため、離散ウェーブレット変換を適用しているが、他の変換も利用可能であり、本発明で同様に利用できる。さらに、この解像度ベースの分解は、生の画像データのコンテントアクセスが可能な圧縮を行なう際、必ずしも実行する必要はない。本発明は、多数の異なるフォーマットでのデータ処理が可能なモジュラーアーキテクチャに基づいている。
【0026】
この好適な実施形態における多重解像度分解の次の段階は、MDHデータの領域フォーマッティングおよび領域コーディングである。ただし、このステップは生の画像データ、または各種の技術を使って多重解像度階層へ変換されたデータに適用できる。本システムのこのステップは、2つの構成要素、すなわち領域階層の形成または決定と、これら領域の形状の後続コーディングとに分けられる。このデータは、本発明のシステムの次の段階に移行する多重領域データチャンネルを形成する。
【0027】
データがその「領域の」優先順位に基づいてコード化されると、エンドユーザ用にスケーラビリティを保持するため、そのデータは再びソートされなければならない。「領域化された」データのプログレッシブソーティングは、効率的に、また圧縮性を加えてデータを編成し、画像の忠実度と、スケーラビリティと、コンテントベースのアクセス可能度とを保持するための、このシステム独自の新しい方法である。
【0028】
システムのソート段階が完了すると、データのエントロピーコーディングが行われる。エントロピーコーディングは、データ圧縮で損失を伴わない方法として当該技術で広く知られている。これは統計的な予測方法に基づいたもので、さらに最終的なデータストリームのサイズ小型化に寄与する。
【0029】
最後に、直前の処理ステップにより生じた異なるタイプのデータの流れを管理するため、多重化(略称MUX)モジュールが組み込まれる。本発明のマルチプレクサを使うと、プログレッシブな送信制御により、ユーザはデコンプレッサ(解凍ソフトウェア)へ送られるデータの「ビットバジェット(ビット予算)」を設定することができる。この機能は、データ送信に利用できる資源、またはエンドユーザの処理用に利用可能な資源が限られている場合に制限を受ける。多重化後、結果として得られる圧縮ビットストリームは多様な媒体を介して本発明のデコーディング構成要素へ送信が可能となる。
【0030】
図2は、本発明の生の画像データのエンコーディングにおける第1ステップの説明図である。前記の説明のとおり、生画像データの分解または変換に利用できる方法は色々のものがあり、したがって、様々な異なるレベルの解像度が採用され得る。ただし、ここで留意すべき点は、これがスケーラブルな変換のために適切な階層を達成するために行われるという点である。現在利用可能な変換のタイプには、ウェーブレット、KL変換、ウェーブレットパッケージ変換、リフティングスキーム、ウィンドウ付きフーリエ変換、離散コサイン変換などがある。なお、本発明の好適な実施形態で特に使用されたウェーブレットはリフティングスキームに基づいたものであるが、当該技術の技術者は、本発明のこのアーキテクチャが他のウェーブレットまたはエンドユーザの特定の目的でデザインされた他の変換も潜在的にサポートすることに注意する必要がある。
【0031】
図2は、前記好適な実施形態に係るウェーブレットを使った、データセットIx,yの多重解像度ベース変換から得られる典型的な結果を示している。このテスト画像「リナ(女性の名前)」は、解像度のレベルに基づいたデータ階層に変換され、かつ3つの空間方向で表示されている。これが「多重解像度分解階層」つまりMDHデータセットである。本発明では、デフォルトで、3若しくは5の異なるレベルの分解が行なわれる。図2では、各解像度レベルにおいて、HL、HH、およびLHで示される3空間方向が示されており、ここで、HLは、水平面で高域スキャン、垂直面で低域スキャンを行うことを意味し、HHは両面で高域スキャンを行なうことを意味し、LHは水平面で低域スキャン、垂直面で高域スキャンを行なうことを意味している。両面で低域スキャンを行うLLは、どの解像度レベルでも意味を持たない情報となるが、階層内の後続解像度レベル(より高い若しくは低い解像度のレベル)では解釈される可能性もある。
【0032】
前述の方法でデータが分解および編成された後の処理ステップは、前述のコンテントアクセス度(コンテンツへの良アクセス性)を実現するためのデータのコーディングである。この目的を達成するため、本発明ではまず「処理対象領域」を定義し、次に「マスク」を定義、記述し、さらにその情報をエンコードして圧縮データストリームの一部にする。
【0033】
このシステムの、この段階を実行するために開発された重要な概念は、幾何学的プログレッシブコーディングである。スケーラビリティを維持しつつ領域ベースのコーディングを行なうには、順序V(解像度係数の大きさ(マグニチュード)の、すなわち前記MDHデータ)を複数の領域データ(すなわち関係R)に関連付けることが不可欠である。これは、図3のコーディングセットへの幾何学的アプローチにつながる。従来技術の混合アプローチ(左)では、サンプル値(変換係数面で0)を使い、より高レベルの解像度におけるゼロ(0)のグループの発生確率を予測する。これに基づき、コンパクトな表示が実現される。ただし、同時に、低レベルの解像度における変換エラーが各レベルの予測に一層深刻な波及効果を及ぼすことには注意が必要である。
【0034】
本発明で採用されている幾何学的アプローチ(右)では、表現の小型化は、大きなサンプル(ゼロ)のセットをカバーする幾何学形状を使用してこの形状をコーディングすることにより達成される。このアプローチでは、MDH内の興味のある処理対象領域は領域及び曲線などの幾何学的オブジェクトの形で表わされ、これらの幾何学的オブジェクトを記述するため定式化したコンパクトなコードが構成される。幾何学的オブジェクトのこのコンパクト化コーディングでは、図4に示した1の主曲線C(leading-one Curve C)が使われている。この定式化およびコーディングの方法の利点は、領域の詳細な記述、これらの領域のコンパクトな表現、および前記タイプの変換エラーに対する堅牢性などである。
【0035】
このようにして、MDHに係数{Cij}のサブセットが与えられた場合、係数絶対値の分布は、これらがスキャンされた順序に関係なく、3つの部分を持つ(図4)。前記の主曲線Cは、最も重要なビットから検索された場合、すべての係数のバイナリ表現のうち最初の非ゼロビットで構成される。修正区域は、前記に後続するすべての係数のバイナリビットからなる。ゼロ区域は、前記主曲線の前にある全係数内のすべてのゼロから構成される。このようにして、全係数の数がn*Nビットで、修正区域の領域が|x|ビットで、ゼロ区域の領域が|0|ビットである場合は、曲線Cの長さがNであるため、|x|+|0|=(n−1)*Nビットとなる。
【0036】
このデータのコーディングで情報の損失を防ぐには、曲線Cと修正区域の情報を正確に記録しなければならない。データ小型化の観点におけるエンコーダのパフォーマンスは、ゼロ区域をコード化する能力、または曲線Cをコード化する能力により決定される。順序Vの観点におけるスケーラビリティを実現するため、曲線Cの高さは増加しないと仮定される。これは、以下に説明するプログレッシブな部分ソート処理を通じて実現される。
【0037】
多重(複数)領域データを作成した処理の最初に戻るが、本発明の好適な実施形態で処理対象領域を決定する方法は3つある。図5では、本システムが以下をサポートしていることがわかる。
【0038】
1.ユーザ定義の領域。このスキームでは、領域は対話型処理(つまり、マウスなどの入力デバイスによりユーザが処理対象領域を指定する場所)または異なる別のアプリケーションプログラムにより決定される。次に、「マスク」はこのユーザ定義領域に基づき構成化される(この領域構成方法は図5aを参照)。
【0039】
2.タイリング。タイリングスキームでは、標準のサイズからなるピクセルブロックが前記領域を形成するために割り当てられる。例としてJPEGでは、8×8ブロックがタイリングによる指定領域として考えられる。タイリングは、コンピュータ支援デザインまたは製造企業などにより生成された非常に大サイズの画像を取り扱う場合には、領域の形成に適切な方法であると考えられる(この領域定式化におけるタイリング方法は、図5bを参照)。
【0040】
3.自動領域構成(この自動処理は図5cに示されている)。この自動領域階層構成においては、MDHデータまたはオリジナルの画像データは、幾何学的領域の階層へとセグメント化される。この発明では、変換−ドメインのセグメント化スキームが開発された。この処理の好適な実施形態では、MDHデータの絶対値または「領域の重要度」を測定することにより、MDHデータが空間的に分離された領域にセグメント化される。ここで、領域の重要度とは、興味のある処理対象領域における全係数の全体的な重要度のグループ測定値を意味する。この発明では、平均的な重要度および重み付き重要度の2タイプの領域の重要度が考慮されている。平均的な領域の重要度は、その領域における全係数の係数重要度の平均値を指し、重み付き領域の重要度は、その領域における全係数の係数重要度の重み付き平均値を指す。
【0041】
本発明の自動領域構成は、次の2つのセグメンテーションアルゴリズムのどちらかにより行われる。第1のアルゴリズム、完全対数スキームでは、MDHデータを順次順序付けるためしきい値2n−1、2n−2、...、2が使われる。ここで、MDH係数の最大値は(I|Cij|)<2であることが知られている。
【0042】
第2のセグメンテーションアルゴリズムは、部分対数スキームに基づいている。このスキームでは、専門知識のあるユーザが決定した特定の2のべき乗のみがしきい値として使われる。
【0043】
前記いずれかのスキームによりMDHデータのしきい値処理を行なった後、MDH面の各空間位置が、対応するしきい値と関連付けられた一意のラベルでマークされる。このようにして、スキームに「n」個のしきい値が使われる場合、MDH面全体はn+1個の識別可能なラベルでマークされる。また、このラベルのセットが領域マスクを形成する。
【0044】
図5(c)は、画像リナの自動セグメンテーションの結果を示している。多重解像度分解の段階で生成されたMDH係数は、このように3つの範囲に分けられる。本発明の好適な実施形態では、これらの範囲はそれぞれ0〜15、16〜31および32〜64である。
【0045】
ここでMDHデータ構造が多重(複数)解像度レベルおよび多重(複数)空間配向性(方向性)を含むことを想起すると、MDHデータのセグメンテーションは共通のマスクセットをすべての解像度レベルおよびすべての配向(方向)に適用することにより実現される可能性がある。すなわち、各方向で全解像度レベルの共通マスクを維持しつつ、異なるマスクを異なる方向に適用するか、異なるマスクを異なる解像度レベルに適用し、任意の解像度レベルで全方向の共通マスクを維持するか、あるいは異なるマスクを異なる解像度と異なる方向とに適用する。
【0046】
本発明の好適な実施形態では、異なる方向の間で自己類似性があるため、第1のアプローチを採用している。すべての解像度レベルにおいて、セットHH1、HL1、およびLH1に境界情報(模様が複雑な領域、またはハイコントラストな領域の情報)が含まれる。一般に、セットHH、HL、およびLHは異なる方向においてバンドパス特徴を捉えているので、どのセットもそれ1つではその解像度レベルでの境界の記述を完了することができない。境界「イベント」の適切な決定は、前記3つの配向性のいずれかでイベントが発生した際に行なわれなければならない。従って、解像度レベル1における一般的な重要度テストでは、以下の動作が使用される。
H1=max{HH1,HL1,LH1}
【0047】
すなわち、領域の重要度は、その位置における3つの方向の各最大値のうち、最も大きい値により決定される。
【0048】
このかわりにH1=a*HH1+b*HL1+c*LH1(ここで、a+b+c=l)とすることもできる。
【0049】
その他、共通マスクを異なる解像度および異なる配向性に適用するのは、異なる解像度レベルでの自己類似性、およびマスク1つだけの計算効率上の理由などによる。つまり、共通マスク1つだけの計算は、一般に複数マスクでの計算よりも経済的に優れているためである。
【0050】
領域形状コーディングは、領域形成ステップで作成される領域マスクのための正確でコンパクトなコードを発見するために行われる。形状コードのコンパクトさと正確さは、どちらもコーディングシステム全体の効率に直接影響を及ぼす。本発明のアーキテクチャでは、多重(複数)形状コーディングスキームがサポートされているが、好適な実施形態では、次のDCTベースの領域チャンネルが使われている。
【0051】
このスキームでは、領域マスクはフーリエ変換特性によりコード化される。周波数ドメインに低域フィルタを適用することにより、高精度および少数のDCT係数で多重領域マスクの全体形状をエンコードすることができる。図6は、DCTでコード化された領域マスクを画像リナに適用した図例を示している。マスクの記述にDCT変換を使うことにより、著しい圧縮効果が得られる。
【0052】
MPHデータの場合、最高の解像度レベルで共通マスクを生成する際、DCTが1つだけ使われる。それより低い解像度レベルの他のマスクは、ダウンサンプリングにより実現される。図7は、領域構成段階から領域ベースのデータリストのコーディングまでのデータの流れを示したものである。アルゴリズムA50と呼ばれるこの処理は、ボトムアップで領域階層形成を行なう方法であり、以下のステップを含む。
【0053】
(1) H1=max{LH1,HL1,HH1}を計算する。すなわち、
k=1〜Nについて、H1[k]=max(LH1[k],HL1[k],HH1[k])
【0054】
(2) 領域形成スキームを共通の重要なマスクH1に適用し、パーティションマスクM1を取得する。
【0055】
(3) 低域フィルタをDCT変換されたマスクM1に適用し、M'を取得する。
【0056】
(4) ダウンサンプリング値M1'を使って、より低い解像度レベルでのマスクM、M、…、Mを取得する(以下のアルゴリズムA51を参照)。
【0057】
(5) マスク{M',M,…,M}を各係数層に適用し、MDHを各領域にセグメント化する。
【0058】
上記のステップ(3)後、最高の解像度レベル(M1)におけるマスクをそれより低い解像度レベルで使用するために変換する処理は、図8に示されたアルゴリズムA51により実行される。
【0059】
アルゴリズム A51:マスクのダウンサンプリング
θ1>θ2>θ3と仮定する。M1内の領域はθ値によりラベリングされていると仮定する。
For (I=2, 3,…, b)
For (all x and y of Mi)
Mi (x, y) = max {Mi-1(2x, 2y), Mi-1(2x, 2y+l), Mi-1(2x+1, 2y), Mi-1(2x+2,2y+2) }
【0060】
この他にも低解像度レベル用にマスクを取得する方法はあるが、前記ダウンサンプリングアルゴリズム(A51)は異なる解像度レベルで正確に領域の形状を維持する。さらに、前記のアルゴリズムは計算効率もよい。
【0061】
再度図1を参照すると、ここでの場合、データはすでに多重解像度分解と領域構成および領域コーディングとの両方を経ている。この段階で、データはそのグラフィックコンテンルに基づき再編成されているが、領域セグメンテーション処理は異なる解像度レベルですべての方向につき領域の形状を維持する一方、異なるレベルおよび異なる配向性について対応する領域における係数の値範囲は維持しない。すなわち、前記関係Rは異なる解像度レベルおよびすべての配向性で受け継がれるが、順序Vは一般に正確に維持されない。プログレッシブソーティングの目的は、すべての領域チャンネルについて順序Vを再確立することである。
【0062】
データのプログレッシブソーティングにおける第1ステップは、領域形成および領域コーディングにより生成された領域のスキャンである。このデータはスキャンされるに従い、MDH係数に対応するリストがスキャン処理時に際作成される。当該技術の技術者には自明なことであるが、スキャンされ、線形リストに変換されるデータの性質に応じて領域データの最適なスキャン方法が決定され、スキャンの効率性が高められる。
【0063】
一般に、スキャンの順序には2つのタイプが考えられる。これらは、線形スキャンおよび「領域縮小」の原理に基づいたスキャンである。本発明の好適な実施形態ではソフトウェアスイッチが使われて、どちらのスキャン方法が採用されるかが決定される。このスイッチはデータの性質を特徴づけ、次に適切な方法を採用および実施する。
【0064】
領域形成および領域コーディングにより生成されたデータをスキャンする第1の方法は、単純な線形解析および各係数のリスト作成である。この方法では、これらの係数は、領域データの最上行の最も左の位置から1行ごとに下降し、最下行の最も右の位置へとスキャンされる。この方法が特定の領域に適用された例が図9(a)に示されている。この線形スキャン法は実施が容易であるが、この方法ではデータ固有の降順または昇順の情報が破壊され、最終結果としてのビットストリームのコンパクトさを失うかもしれないという大きな問題がある。これは、山峰などの風景または同様な輪郭形状を伴う画像の場合に起こる。ただし、細かいパターンを持つ領域、および値の変化が緩やかな領域の場合は、線形スキャンは比較的効率的な可能性がある。
【0065】
領域ベースの係数をスキャンする第2の方法は、領域縮小の原理に基づいたものである。この方法は図9(b)に示されており、数学的な内容は以下のアルゴリズムA62に示されている。
【0066】
アルゴリズム A62
Input: label L, mask [m][n], inBuf [m][n];
Output outBuf [N]
ステップ1. K=0
J0 = min {J: mask [I][J] = L};
J1 = max {J: mask [I][J] = L};
ステップ2. While (J0 < J1) do
{
ステップ2.1. For (J=J0; J<=J1; J++) {
While ((Find I0 = left {I: mask [J][I] = L}) = true) d
o
{
Find I1 = right {I: mask [J][I] = L});
Append inBuf [J][I0] to outBuf [K++];
Mask [J][I0] = NIL:
If(I1 <>I0)
Append inBuf [J][I1] to outBuf [K++];
Mask [J][I1] = NIL;
}
}
}
ステップ2.2. (Update J0 and J1.)
J0 = min {J: mask [J][I] =
11 = max {J: mask [J][I] =
}
【0067】
図10は、さらに領域縮小処理を図示したものである。山峰の風景など多くの場合、このスキャンの領域縮小方法は効果的および効率的にデータの大きさの順序を維持できる可能性がある。
【0068】
領域Rに対する線形リストLを生成する際どのようなスキャン方式が採用されても、順序Vを確立するためにソーティング(並び替え)を実行する必要がある。本発明では、主曲線のレベルまでの部分順序付けが採用されている。従って、リストL={C1、C2、Cm}、すなわち分解係数について前記で生成されたリストが与えられた場合、以下のプログレッシブなコーディングアルゴリズムが実行される。
【0069】
アルゴリズムA620 プログレッシブソーティング
ステップ1. L内の各Ciにつき、n番目のmsb(Ci)を出力する。
ステップ2. msb=1であるアイテムにつき、msbの次の値を出力し、そのアイテムをLから取り除く。
ステップ3. n=n−1とし、ステップ1.へ戻る。
【0070】
このアルゴリズムは完全でなく部分的に、リスト「L」を2乗までソートする。これは、出力データリストが与えられた任意の位置で切り捨てられる可能性があるが、デコーダは大部分の有用な情報を得ることができるという点でプログレッシブな処理である。最後に、これはリストLを拡張しない。つまり、完全でデータを損失しないようLをソートするため、ソート後の出力の全体長はLに等しい。
【0071】
前記アルゴリズムA620は、多数のアイテムが著しく小さい値を持つ場合に非効率的になる。このイベントでは、各アイテムのバイナリ表現において顕著な量のビットバジェットが主曲線前の0に費やされる。次のアルゴリズムでは、しきい値「b」を決定して使用し、これらの低い値係数を高い値係数から分離することによりパフォーマンスが向上する。
【0072】
アルゴリズム A621 バイパーティションプログレッシブソーティング
ステップ1. 所定の0<=b<=nにつき、Lの各Ciで|Ci|<2かどうかをチェックし、しきい値を越えるものについてはL1へ出力し、しきい値より小さいものについてはL2へ出力する。
ステップ2. L1のアイテムにnからアルゴリズムA620を適用する。
ステップ3. L2のアイテムにbからアルゴリズムA620を適用する。
【0073】
プログレッシブソーティングには2つの基本要件がある。(1)ソーティング処理の出力ビットストリームがデコードされる場合、データはVの降順で作成されなければならない。(2)データの一部が再構築されるよう、ビットストリームが切り捨てられる場合、再構築されたデータの情報量を最大にしなければならない。
【0074】
エントロピーコーディング
再び図1を参照すると、このシステムにおける次のステップはデータのエントロピーコーディングである。エントロピーコーディングは、データ圧縮の際データの損失を伴わない方法として当該技術で広く知られている。これは、バイナリコードがデータを維持する特性と、同様なデータ列の繰り返しとに基づいている。また、予測の方法に基づいたものでもある。本発明では、2つの異なる方法のエントロピーエンコーディングが使われている。これは、本発明のプログレッシブソーティングの結果得られる2タイプのデータの統計的な性質のためである。B型データは先行する1の曲線を形成するデータで、A型データは先行する1の曲線より下の修正区域におけるすべてのデータを指す。
【0075】
多重化
エンコーダシステムの多重化機能およびデコーダシステムの逆多重化機能は、柔軟性のあるビットレートと質の高い圧縮画像を提供する対話型手段を持つエンコーダおよびデコーダを備えている。
【0076】
ビットバジェット制御におけるこの双方向性は、エンコーダとデコーダのどちらもビットバジェットの決定および割り当て処理に対する制御手段を持つためである。圧縮ビットストリームのビット総数を決定するため、マルチプレクサではベースビットバジェット(BBB)が指定および使用される。逆多重化処理では、デコーディングビットバジェット(DBB)を使用して、デコーディング前にさらに選択的にビットストリームを切り捨てることができる。
【0077】
マルチプレクサの各機能は図12に示すとおりで、代表的なものには以下がある。
【0078】
(1)画像全体をエンコーディングするため、与えられたベースビットバジェット(BBB)で各解像度レベルおよび領域チャンネルのビットバジェットを決定する。
【0079】
(2)異なるチャンネルから単一ビットストリームへデータをインターリーブする。端数切り捨て後、異なる領域、異なる方向及び異なる解像度レベルから並び替え、端数切捨てられたデータは一緒にパックされて最終的なビットストリームとなる。図11に示すように、このデータパックのデフォルト順序は次のとおりである。
【0080】
a.異なる解像度レベルにおけるデータは、最低の解像度から最高の解像度へ、すなわちレベル5→レベル4→レベル3→レベル2→レベル1の順でパックされる。
【0081】
b.各解像度レベル内で、3つの空間方向に対して特に優先的な順序は指定されない。デフォルトで、データはHL→LH→HHの順にスキャンされる。
【0082】
c.与えられた解像度レベルにおける特定の方向内で、領域は最高領域ラベルから最低ラベルの順にスキャンされる。
【0083】
本発明の好適な実施形態では、圧縮ビットストリームが作成された後、画像の再生を可能にするデコーディング処理が行われる。ビットバジェットおよび圧縮ビットストリームの作成仮定で採用されたステップに応じ、オリジナルの画像は完全な忠実度で、または一部の情報を欠いて生の画像データに復元される。
【0084】
本システムのエンコーディング側のマルチプレクサを補足するため、図13に示すとおり、本発明では逆多重化構成要素がデコーディング側に含まれている。本発明の好適な実施形態は、ユーザが本システムのデコーディングの際に独自のビットバジェットを決定でき、可能性として任意の決定値でデータを切り捨てることもできるという追加機能を持つ。この「デコーディングビットバジェット」は、図10に示すとおり、逆多重化ステップの前に決定される。
【0085】
図14は、本システムのデコーディングのその他の部分を示している。このデコーディング処理では、主として単に本システムのエンコーディングの逆のステップがたどられる。
【0086】
デマルチプレクサ(図14)の機能は以下のとおりである。
【0087】
(1)圧縮ビットストリームを別個のデータリストに解凍する。
【0088】
(2)デコーディングビットバジェット(DBB)をデータリストの切り捨てに適用する。空間領域の点でスケーラビリティの全スペクトルをカバーするため、空間解像度、ピクセル精度、空間配向性、ビットバジェット制御スキームのセットが設計されている。
【0089】
本発明は、本発明の要旨を変更しない範囲で、種々の変形が可能である。
【図面の簡単な説明】
【図1】 図1は、本発明のシステムとアーキテクチャに係る詳しい複数パスでの伸長を示す図。
【図2】 図2は、イメージ"レナ"についてウェーブレットベースの変換を用いることで得られた複数解像度デコンプレッション階層を示す図。
【図3】 図3は、対象領域をコーディングするためのこの発明の幾何学的アプローチの概略を示す図。
【図4】 図4は、対象領域をコーディングするのに適用される"リーディング・ワン"のコンセプトを描く図。
【図5】 図5は、スチルイメージ"レナ"に適用される3つのタイプの領域形成スキームを示す図。
【図6】 図6は、スチルイメージ"レナ"に適用されるDCTを利用した重要な領域のコーディングを示す図。
【図7】 図7は、領域階層形成の方法を示すフロー図。
【図8】 図8は、アルゴリズムA51の動作及び連続する解像度レベルのための領域マスクのダウンサンプリングを示すフロー図。
【図9】 図9は、領域エンコードされたデータをスキャンするための2つの異なる方法を示す図。
【図10】 図10は、領域縮小方法を用いた領域データの好ましいスキャン方法を示すフロー図。
【図11】 図11は、圧縮側システムのマルチプレクサ内でデータがパックされる順序を示す詳細なフロー図。
【図12】 図12は、圧縮システムのマルチプレクサの内部アーキテクチャを示すフロー図。
【図13】 図13は、伸長側のシステムの逆マルチプレクサの内部アーキテクチャを示すフロー図。
【図14】 図14は、伸長システム及びアーキテクチャの詳細な複数パスのフロー図。

Claims (28)

  1. デジタル静止画像(10)を領域ベースでエンコーディングし、スケーラブルでコンテンツへのアクセスが可能な圧縮ビットストリーム(60)を作成するための方法であって、
    前記デジタル静止画像の生画像データを多重解像度サブイメージを有する多重解像度分解階層に分解し(20)、前記多重解像度サブイメージを順序付けする工程であって、前記多重解像度サブイメージは大きさ(マグニチュード)を有する多重解像度係数を含むものである、工程と、
    処理対象領域を決定する工程(30)と、
    第1レベルの解像度の処理対象領域を特定するための領域マスクを定義する工程(30)と、
    前記第1レベルの解像度の処理対象領域の領域マスクを幾何学的プログレッシブエンコーディングを使ってエンコーディングする工程(40)と、
    解像度の後続レベル用の領域マスクを決定し、この領域マスクをエンコーディングする工程と、
    多重解像度係数の大きさに基づいて、エンコードされた領域マスクをスキャンしプログレッシブにソートする工程(50)と、
    前記圧縮ビットストリームを構成する工程であって、前記圧縮ビットストリームは前記エンコードされソートされた領域マスクを含むものである、工程と、
    を有する方法。
  2. 請求項1記載の方法において、前記多重解像度サブイメージの階層は、ウェーブレット変換に基づき作成されるものである。
  3. 請求項1記載の方法において、前記多重解像度サブイメージの階層は、フーリエベースの変換に基づき作成されるものである。
  4. 請求項1記載の方法において、前記多重解像度サブイメージの階層は、生画像データを使って作成されるものである。
  5. 請求項1記載の方法において、前記処理対象領域は、自動工程により決定されるものである。
  6. 請求項1記載の方法において、前記処理対象領域は、ユーザ定義により決定されるものである。
  7. 請求項1記載の方法において、前記幾何学的プログレッシブエンコーディングは、フーリエ変換を使用するものである。
  8. 請求項1記載の方法において、前記幾何学的プログレッシブは、ウェーブレット変換を使用するものである。
  9. 請求項1記載の方法において、領域ベースのデータは、多重解像度係数のリストを作成するため、線形にスキャンされる。
  10. 請求項1記載の方法において、領域ベースのデータは、多重解像度係数のリストを作成するため、領域縮小プロトコルを使ってスキャンされる。
  11. 請求項1記載の方法において、前記多重解像度係数のリストは、プログレッシブな部分ソート体系を使ってソートされる。
  12. 請求項1記載の方法において、前記多重解像度係数のリストは、所定のパーティションに基づいて分割されたデータを使ったプログレッシブなソート体系によりソートされる。
  13. 請求項1記載の方法は、さらにエントロピーコーディングの最適な手段を決定するソフトウェアスイッチの工程を有する。
  14. 請求項1記載の方法は、異なる領域及び解像度チャンネルからの圧縮データを統合ビットストリームにアセンブルすることにより、エンコーダ及びデコーダの両方が、選択的及びインタラクティブに、ビットバジェット及び圧縮画像の質を制御できるようにする、多重化プロトコルの工程をさらに有する。
  15. デジタル静止画像を領域ベースでエンコーディングし、スケーラブルでコンテンツへのアクセスが可能な圧縮ビットストリームを作成する装置であって、前記装置は、
    前記デジタル静止画像の生画像データを多重解像度サブイメージを有する多重解像度分解階層に分解し、前記多重解像度サブイメージを順序付けする手段であって、前記多重解像度サブイメージは大きさ(マグニチュード)を有する多重解像度係数を含むものである、手段と、
    処理対象領域を決定する手段と、
    第1レベルの解像度の処理対象領域を特定するための領域マスクを定義する手段と、
    前記第1レベルの解像度の処理対象領域の領域マスクを幾何学的プログレッシブエンコーディングを使ってエンコーディングする手段と、
    解像度の後続レベル用に領域マスクを決定し、前記領域マスクをエンコーディングする手段と、
    多重解像度係数の大きさ(マグニチュード)に基づいて前記エンコードされた領域マスクをスキャンし、プログレッシブにソートする手段と、
    前記圧縮ビットストリームを構成する手段であって、前記圧縮されたビットストリームは前記ソートされエンコードされた領域マスクを含む、手段と、
    を有する装置。
  16. 請求項15記載の装置において、前記多重解像度サブイメージの階層は、ウェーブレット変換に基づき作成されるものである。
  17. 請求項15記載の装置において、前記多重解像度サブイメージの階層は、フーリエベースの変換に基づき作成されるものである。
  18. 請求項15記載の装置において、前記多重解像度サブイメージの階層は、生画像データを使って作成されるものである。
  19. 請求項15記載の装置において、前記処理対象領域は、自動工程により決定されるものである。
  20. 請求項15記載の装置において、前記処理対象領域は、ユーザにより決定されるものである。
  21. 請求項15記載の装置において、前記幾何学的プログレッシブエンコーディングは、フーリエ変換を使用するものである。
  22. 請求項15記載の装置において、前記幾何学的プログレッシブエンコーディングは、ウェーブレット変換を使用するものである。
  23. 請求項15記載の装置において、領域ベースのデータは、多重解像度係数のリストを作成するため、線形にスキャンされるものである。
  24. 請求項15記載の装置において、領域ベースのデータは、多重解像度係数のリストを作成するため、領域縮小プロトコルを使ってスキャンされるものである。
  25. 請求項15記載の装置において、前記多重解像度係数のリストは、プログレッシブな部分ソート体系を使ってソートされるものである。
  26. 請求項15記載の装置において、前記多重解像度係数のリストは、所定のパーティションに基づいて分割されたデータを使ったプログレッシブなソート体系によりソートされるものである。
  27. 請求項15記載の装置は、エントロピーコーディングの最適な手段を決定するソフトウェアスイッチを使用するものである。
  28. 請求項15記載の装置は、異なる領域及び解像度チャンネルからの圧縮データを統合ビットストリームにアセンブルすることにより、エンコーダ及びデコーダの両方が、選択的及びインタラクティブに、ビットバジェット及び圧縮画像の質を制御できるようにする、多重化手段をさらに有するものである。
JP2000560732A 1998-07-15 1999-07-15 領域ベースのスケーラブルな画像コーディング Expired - Fee Related JP4215269B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US9312498P 1998-07-15 1998-07-15
US60/093,124 1998-07-15
PCT/CA1999/000641 WO2000004721A1 (en) 1998-07-15 1999-07-15 Region-based scalable image coding

Publications (3)

Publication Number Publication Date
JP2002521880A JP2002521880A (ja) 2002-07-16
JP2002521880A5 JP2002521880A5 (ja) 2005-10-27
JP4215269B2 true JP4215269B2 (ja) 2009-01-28

Family

ID=22237324

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000560732A Expired - Fee Related JP4215269B2 (ja) 1998-07-15 1999-07-15 領域ベースのスケーラブルな画像コーディング

Country Status (10)

Country Link
EP (1) EP1095519B1 (ja)
JP (1) JP4215269B2 (ja)
CN (1) CN100341331C (ja)
AT (1) ATE364966T1 (ja)
AU (1) AU769818B2 (ja)
CA (1) CA2337430C (ja)
CZ (1) CZ2001173A3 (ja)
DE (1) DE69936304T2 (ja)
RU (1) RU2001104340A (ja)
WO (1) WO2000004721A1 (ja)

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6804403B1 (en) 1998-07-15 2004-10-12 Digital Accelerator Corporation Region-based scalable image coding
RU2001106645A (ru) 1998-08-10 2003-03-10 Диджитал Экселерейтор Корпорейшн (Ca) Встроенные элементарные волновые функции дерева квадрантов в сжатии изображения
CA2261833A1 (en) * 1999-02-15 2000-08-15 Xue Dong Yang Method and system of region-based image coding with dynamic streaming of code blocks
US6580759B1 (en) * 2000-11-16 2003-06-17 Koninklijke Philips Electronics N.V. Scalable MPEG-2 video system
FR2822331B1 (fr) * 2001-03-19 2003-07-04 Canon Kk Codage et decodage de signal numerique, avec segmentation hierarchique
US6882755B2 (en) * 2001-10-19 2005-04-19 Hewlett-Packard Development Company, L.P. Image transmission for low bandwidth with region of interest
JP3941668B2 (ja) * 2002-11-11 2007-07-04 松下電器産業株式会社 細胞の観察方法
KR102385188B1 (ko) 2017-09-29 2022-04-12 삼성전자주식회사 외부 전자 장치에서 생성된 정보를 이용하여 이미지 데이터를 처리하는 방법 및 전자 장치
US11678085B2 (en) * 2020-11-16 2023-06-13 Sony Semiconductor Solutions Corporation Data compression method, data compression device, solid-state imaging device, data decompression device and electronic system

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2046544C (en) * 1990-07-10 1995-09-12 Tsugio Noda Image data encoding system
US5748903A (en) * 1995-07-21 1998-05-05 Intel Corporation Encoding images using decode rate control
AUPO329396A0 (en) * 1996-10-28 1996-11-21 Commonwealth Scientific And Industrial Research Organisation Image transmission

Also Published As

Publication number Publication date
AU4597699A (en) 2000-02-07
DE69936304T2 (de) 2008-02-14
CN100341331C (zh) 2007-10-03
CA2337430A1 (en) 2000-01-27
CZ2001173A3 (cs) 2001-08-15
EP1095519A1 (en) 2001-05-02
AU769818B2 (en) 2004-02-05
DE69936304D1 (de) 2007-07-26
CA2337430C (en) 2005-05-24
RU2001104340A (ru) 2003-01-27
JP2002521880A (ja) 2002-07-16
ATE364966T1 (de) 2007-07-15
WO2000004721A1 (en) 2000-01-27
CN1316161A (zh) 2001-10-03
EP1095519B1 (en) 2007-06-13

Similar Documents

Publication Publication Date Title
US5881176A (en) Compression and decompression with wavelet style and binary style including quantization by device-dependent parser
US5966465A (en) Compression/decompression using reversible embedded wavelets
US6757437B1 (en) Compression/decompression using reversible embedded wavelets
US6125201A (en) Method, apparatus and system for compressing data
US6804403B1 (en) Region-based scalable image coding
US6879727B2 (en) Decoding bit-plane-encoded data using different image quality for display
KR100880039B1 (ko) 웨이블릿 기반 이미지 코덱에서의 부호화 이득을 달성하는방법 및 시스템
JP4365957B2 (ja) 画像処理方法及びその装置及び記憶媒体
US7366319B2 (en) Embedding a multi-resolution compressed thumbnail image in a compressed image file
US8068544B2 (en) Compression with doppler enhancement
WO2005027506A1 (en) Methods of compressing still pictures for mobile devices
JP2000513895A (ja) データを圧縮するための方法、装置およびシステム
Xiao et al. A fast JPEG image compression algorithm based on DCT
US7949725B2 (en) System including a server and at least a client
US20030068089A1 (en) Image processing system processing code data
JP4215269B2 (ja) 領域ベースのスケーラブルな画像コーディング
EP1324618A2 (en) Encoding method and arrangement
US7016548B2 (en) Mobile image transmission and reception for compressing and decompressing without transmitting coding and quantization tables and compatibility with JPEG
JPH1084484A (ja) データ圧縮システム
JPH10112862A (ja) デジタルデータ処理方法
CN1396769A (zh) 运动图像信息的压缩方法及其系统
Galan-Hernandez et al. Advances in image and video compression using wavelet transforms and fovea centralis
Liu et al. Digital Image and Video Compression Techniques
Kountchev et al. New Format for Coding of Single and Sequences of Medical Images
JPH10173933A (ja) 一定圧縮率静止画圧縮装置及びその方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20040326

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040325

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040325

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20040325

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040629

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20040811

A975 Report on accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A971005

Effective date: 20040817

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20040818

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050104

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20050315

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050324

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20050315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050607

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20050816

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20050823

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060214

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20060412

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060614

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060815

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20060908

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20081002

A602 Written permission of extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A602

Effective date: 20081021

R155 Notification before disposition of declining of application

Free format text: JAPANESE INTERMEDIATE CODE: R155

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081101

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111114

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121114

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees