JP2000513895A - データを圧縮するための方法、装置およびシステム - Google Patents

データを圧縮するための方法、装置およびシステム

Info

Publication number
JP2000513895A
JP2000513895A JP10508277A JP50827798A JP2000513895A JP 2000513895 A JP2000513895 A JP 2000513895A JP 10508277 A JP10508277 A JP 10508277A JP 50827798 A JP50827798 A JP 50827798A JP 2000513895 A JP2000513895 A JP 2000513895A
Authority
JP
Japan
Prior art keywords
image
data
vector
pixels
pixel
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP10508277A
Other languages
English (en)
Inventor
ザドア、アンドリュー、マイケル
Original Assignee
ダブリュディーイー インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ダブリュディーイー インコーポレイテッド filed Critical ダブリュディーイー インコーポレイテッド
Publication of JP2000513895A publication Critical patent/JP2000513895A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T9/00Image coding
    • G06T9/008Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • H04N19/147Data rate or code amount at the encoder output according to rate distortion criteria
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/1883Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit relating to sub-band structure, e.g. hierarchical level, directional tree, e.g. low-high [LH], high-low [HL], high-high [HH]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • H04N19/63Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets
    • H04N19/64Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission
    • H04N19/647Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding using sub-band based transform, e.g. wavelets characterised by ordering of coefficients or of bits for transmission using significance based coding, e.g. Embedded Zerotrees of Wavelets [EZW] or Set Partitioning in Hierarchical Trees [SPIHT]
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/90Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using coding techniques not provided for in groups H04N19/10-H04N19/85, e.g. fractals
    • H04N19/94Vector quantisation
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/115Selection of the code volume for a coding unit prior to coding
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/146Data rate or code amount at the encoder output
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/30Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using hierarchical techniques, e.g. scalability
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/65Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using error resilience
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/85Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression
    • H04N19/89Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using pre-processing or post-processing specially adapted for video compression involving methods or arrangements for detection of transmission errors at the decoder

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

(57)【要約】 画像データ圧縮のための装置と方法によって、絶対画像値の範囲に対して最高位から決定されたより小さい絶対値にまで、ファイルサイズまたは品質に基づいて変更済みゼロツリーコーディングが実行される。画像中により詳細な情報を維持したい場合は、ベクトル量子化器が、この決定済みの小さな値未満の残余の値をゼロにコーディングして、無損失エントロピーコーディングが、2つのコーディングステップに対して実行される。決定済みのより小さい値はツリーのヒストグラムを試験する、またはこれを繰り返して、なんらかの適切な測定基準によってどちらか決定されるか、事前選択された圧縮済み画像サイズ判断基準を満足させるか、または事前定義されたレベルの画像品質を満足させることによって調節可能である。圧縮予定の画像がRGB空間内にある場合、本装置はRGB画像を、さらなる処理を開始する前に、冗長度の少ない色空間に変換する。

Description

【発明の詳細な説明】 データを圧縮するための方法、装置およびシステム 発明の分野 本発明はデータを圧縮する方法、装置およびシステムに関する。より具体的に は本発明は画像等に関するデータの圧縮に関する。 発明の背景 データ圧縮システムは周知である。本質的には、データ圧縮システムは、元の データストリーム即ちファイル上で動作し、データの冗長性を利用し、および/ または、余分のデータを除去して、伝送または格納に適した圧縮フォーマットに データのサイズを縮小する。このようなデータを使用したいときは、通常に使用 できる形式になるように圧縮解除される。データ圧縮システムには実質的に2つ の形式がある:可逆(無損失)システムと不可逆(有損失)システムである。 可逆圧縮システムは、元のデータを正確に回復する必要がある場合に用いられ 、このようなシステムは一般的には、実行可能なプログラムファイル、データベ ースレコードなどのデータに対して用いられる。可逆圧縮システムには、ハフマ ン(Huffman)コーディング、算術コーディング、デルタ変調およびLZ W圧縮がある。圧縮されるデータ(データのエントロピー)中の冗長度によって 、可逆圧縮システムは通常は、現実世界画像に対しては約2対1または3対1の 圧縮比率(それぞれ2:1または3:1と表現される)を提供することができる 。 不可逆圧縮システムは、元のデータを正確に回復する必要はないが、その代わ りにこのようなデータを容認できる程度に近似させる場合に用いられる。可逆圧 縮システムとは違って、不可逆圧縮システムは、データの回復近似のための基準 にだけ従って、希望されるほとんどあらゆる圧縮比率を提供するように設計する ことができる。 不可逆圧縮システムの1つの共通した用途は画像圧縮であるが、この理由は、 画像は一般的に不可逆圧縮を実行可能であり、圧縮解除しても視覚的に容認でき る結果となるからである。例えば、ディジタル静止画像はしばしば、格納および /または伝送のためのJPEG(結合写真エキスパートグループ)圧縮システム で処理される。JPEGアルゴリズムは多くの文献で説明されているが、その中 には、Van Nostrand Reinhold Publishersの ペネバーカー(William Pennebaker)やミッチェル(Joa n L. Mitchell)による「JPEG静止画像データ圧縮基準」(J PEG Still Images Data Compression St andard)があるが、その内容は参照されてここに組み込まれる。回復され た画像の意図する用途によって、JPEGシステムは、一般的には2:1と40 :1の間の圧縮比率であるさまざまな希望の圧縮比率に設定することができるが 、実際には、標準のJPEG圧縮システムを用いる際には、JPEG圧縮の好ま しくないアーチファクト(ブロッキング、モアレパターニング、「切り傷と押し 傷」、色量子化など)が、12:1を越えるように圧縮された小さい画像を圧倒 してしまう傾向がある。 ビデオ画像もまた、不可逆圧縮システムで圧縮することができ、MPEG(動 画エキスパートグループ)圧縮基準ならびにMPEG−11およびMPEG−I I圧縮基準がこのような用途で用いられる合理的なシステムとして提案されてき た。しかしながら、MPEGの場合の圧縮の典型的な好ましくはアーチファクト には、JPEGアーチファクトのすべてと移動中のエッジでの「ぎらつき」と色 の脈動がある。ぎらつきアーチファクトは、ブロックの平均値から非常に隔たっ た値を画素が持ち、このため、このような過度の値を持つ画素が、景色の中のオ ブジェクトが動いたりカメラの移動/ズーミングのためにブロックからブロック に移動するに連れて、ブロックの照度および/または色差の平均値をフレーム毎 にずらしてしまう。また、変換における最下位の周波数の項目を量子化すると、 色のガミュートを不可逆的に量子化してしまい、その後に続くあらゆる挿入や編 集が、やがて画像の歪みの発生を助長することになる。 不可逆圧縮システムは、圧縮比率が増加するが回復される画像の分量は減少す る、すなわち、圧縮比率が増大するとデータ近似は劣化する。残念なことに、ビ デオのプロバイダー、インターネット、POTS回線(一般の旧式の電話サービ ス回線)のユーザなどが要請したり必要とするより高い圧縮比率を採用すると、 本発明者にとって周知の従来技術によるあらゆる不可逆圧縮システムでも、合理 的な帯域幅で大きな画像を伝送したり格納したりしなければならないときに、回 復された画像の視覚品質が容認できないものとなってしまう。不可逆圧縮の際の 必要とされる副産物はあらゆる統計的なシーンの歪みであるが、処理と濾過の判 断基準を注意深く選択すれば、視覚劣化の開始点を遅らせて、PSNRの「低統 計的品質」の範囲にかなり入り込ませることができる。同様に、唯一の判断基準 としてPSNRを用いてファイルサイズを注意深く最小化すると、テクスチャや 光パターンなどの低視覚活動領域では画像が浸食されたように見えるが、PSN Rは非常に高くすることができる。 例えば、JPEGシステムで12:1を越える比率で圧縮された256x25 6画素の単色8ビット静止画像は一般的には、その不細工さが容認しがたいもの となるが、これは、JPEGシステムの離散コサイン変換(DCT)ブロック処 理段階のアーチファクトである。JPEGシステムで類似の比率に圧縮された類 似の画像は、高コントラスト境界近傍に容認しがたい「縞状の線が付く」効果と ギブズ(Gibbs)現象を示す。 一般的に、回復済みの画像の目に見えるような劣化は圧縮アーチファクトと呼 ばれ、より有用な圧縮比率においてはアーチファクトが気が付かないかまたは少 なくともHVS(人間の視覚系)ではあまり気が付かないような不可逆圧縮シス テムの開発、さらに、HVBに対してよりチューニングされた、より良好な分析 手順に起因するより低いエントロピーを持った可逆圧縮システムの開発に注意が 向けられている。 発明の要約 本発明の1つの目的は、先行技術の不利点を解消したり軽減したりするような 新規なデータ圧縮の方法、装置およびシステムを提供することである。 本発明の第1の態様によれば、ディジタルデータを圧縮して、後の再構成のた めに圧縮画像データセットを得る方法が提供されるが、この方法は: (i)ディジタル画像がRGB色空間におけるカラー画像であるか否かを決定 し、決定されたRGBカラー画像をより冗長度の少ない色空間に変換するステッ プと; (ii)前記冗長度の少ない色空間中の画像の色平面のそれぞれに対してさざ なみ分解を実行して、個々の色平面に対してDC項目と非DC項目を変換するス テップと; (iii)DC項目に無損失デルタコーディングを実行するステップと; (iv)前記変換結果を符号と大きさのフォーマットに変換し、非DC項目 (すなわち微分項目またはAC項目)を絶対的大きさに基づいて第1の範囲と第 2の範囲に分離する隣接する1対のビット平面(または隣接する1対の大きさ) を具備する分割点を選択するステップであり、前記第1の範囲が、前記変換結果 の第2の範囲内の値より大きい前記変換結果の値を具備するステップと; (v)スカラー量子化器を用いて、第1の範囲中の値を符号化するステップと ; (vi)べクトル量子化器を用いて、第2の範囲中の値を符号化するステップ と; (Vii)無損失エントロピーコーダによって設定された結果データセットを コーディングして、圧縮された画像データセットを得るステップと; を含む。 本方法はまた、要望によりDC項目の無損失コーティング、変更済みゼロツリ ーおよび/またはベクトル量子化器に、エラー検出コードおよび補正コードを、 再構成された最終的な品質に対するコーディング済み情報の重要性及び圧縮要件 に基づいて適用できるようにすることが好ましい。本方法は視覚的に最も有意の データを最小の(そして短時間で送られる)ブロックにコーディングし、これに よって、視覚データをほとんど含まない最後の(そして実質的に最大の)ブロッ クに対してより厳密でないエラー制御を実行し、次第に、個々の後続の(より大 きいが視覚的にはより重要でない)ブロックに対してより厳密でないエラー制御 を実行することを可能とする。また、無損失エントロピーコーディングとしては 、当業者にとって思いつくようなLZWコーディング技法、LZ77コーディン グ技法、算術コーディング技法、同時多数モデル駆動式算術コーディング技法、 ハフマンコーディング技法または他のあらゆる適切な無損失コーディング技法で あることが好ましい。また、本方法はさらに、分割点を定義するステップ以前に 、 視覚感度ルールを用いて、画像中の他の情報によりマスクされることによって見 えなくなる要素を除去することによってまたはより厳格に量子化することによっ て変換におけるデータを減損させるステップをさらに含むのが好ましい。例えば 、明るい画像の暗い領域は、それらの領域の低照度の微妙な変化を覆い隠してし まい、このため、目に見える変化のみを伝送する必要がある。 本発明の別の態様によって、ディジタルデータを圧縮して、後の再構成処理の ための圧縮済み画像データセットを得る装置が提供され、この装置は: ディジタル画像データを検出してそれをRGB色空間から冗長度のより少ない 色空間に変換する手段と; 前記冗長度の低い色空間中の前記画像の各色平面のさざ波分解を実行して、D C項目および非DC項目の変換を得る手段と; 前記DC項目を無損失で符号化する手段と; 前記変換結果を符号と大きさのフォーマットに変換し、絶対的大きさに基づい て、非DC項目を第1と第2の範囲に分離する1対の隣接するビット平面または 隣接する大きさを含む分割点を選択するまたは選択されることを許可する手段で あり、前記第1の範囲が、変換結果の第2の範囲に含まれる値より大きい変換結 果の値を含む手段と; 前記第1の範囲に含まれる値を符号化するスカラー量子化器手段と; 前記第2の範囲に含まれる値を符号化するベクトル量子化器手段と; その結果得られるデータセットを無損失で符号化して、圧縮済みの画像データ セットを得る手段と; を具備する。 本発明の更に別の態様によって、ディジタル画像圧縮装置を実現するために内 部に実現されたコンピュータで読み取り可能なプログラムコード手段を有するコ ンピュータ使用可能媒体を具備する製品が提供され、前記製品内の前記コンピュ ータ読み取り可能プログラムコード手段は: RGB色空間からディジタル画像データを検出してこれを冗長度の少ない色空 間に変換するようにコンピュータに命令するコンピュータ読み取り可能プログラ ムコードと; 前記冗長度の少ない色空間内の前記画像の各色平面の適切なさざ波分解を実行 してDC項目と非DC項目の変換結果を得るようにコンピュータに命令するコン ピュータ読み取り可能プログラムコード手段と; 前記DC項目を無損失で符号化するようにコンピュータに命令するコンピュー タ読み取り可能プログラムコード手段と; 前記変換結果を符号と大きさのフォーマットに変換し、また、絶対的大きさに 基づいて、非DC項目を第1と第2の範囲に分離する1対の隣接するビット平面 または隣接する大きさの値を含む分割点を選択するようにコンピュータに命令す るコンピュータ読み取り可能プログラム手段であり、前記第1の範囲が、変換結 果の第2の範囲に含まれる値より大きな変換結果の値を含む手段と; スカラー量子化を実行して、前記第1の範囲に含まれる値を符号化するように コンピュータに命令するコンピュータ読み取り可能プログラムコード手段と; ベクトル量子化を実行して、前記第2の範囲に含まれる値を符号化するように コンピュータに命令するコンピュータ読み取り可能プログラムコード手段と; その結果得られるデータセットを無損失に符号化して、圧縮済み画像データセ ットを得るようにコンピュータに命令するコンピュータ読み取り可能プログラム コード手段と; を具備する。 本発明による更に別の態様によって、DC項目と非DC項目から成るさざなみ 変換済みのディジタル情報を符号化する方法が提供され、この方法は: (i)前記変換済みディジタル情報中に階層を確立するステップであり、この 場合、DC項目に隣接する最上位レベルにある3つの方位付けブロックの各々の 中の各画素が、次に低いレベルにある対応するブロック内の対応する2x2アレ イの子画素の親として識別され、さらにより低いレベルの各々に対して前記識別 動作を繰り返すステップと; (ii)符号化される階層の最上位レベルから最下位レベルに対して、今度は 優性パス中のレベルにある対応する水平方向と垂直方向と直交方向の画素の個々 のトリオを検査して、以前には重要であると見なされていなかった画素を識別し 、また、現在のレベルにある前記識別された有意の画素のアドレスと符号を無損 失 に符号化して、より低いレベルから最下位のレベルに至る各レベルにある2x2 アレイの子画素のトリオを検査し、これらの新たな有意の画索を識別するステッ プであり、DC画像を囲む最上位のACブロックを完全ラスタ走査することによ ってアドレスが暗に符号化され、各有意ツリーのそれ以降の後続のアドレスは、 各ツリー中の後続の有意さをコーディングするために用いられる埋め込み記号に よって暗示されるステップと; (iii)前記ツリーの画素中のゼロツリーの根を識別し、これらのツリーか ら、このようなゼロツリールートから従属する有意の画素を除去するステップと ; (iv)従属パス中で、優性パスで識別されたすべての有意画素の大きさを、 優性パスが実行されたと同じ順序で出力するステップであり、前記出力の大きさ が、視覚ルールセットに基づいた事前選択された数値精度を有するステップと; (v)シャピロ(Shapiro)のEZWコードと同様の方法で、最下位レ ベルが処理されるまで各レベルに対してステップ(ii)から(iv)を繰り返 すか;または、ゼロツリーの1つの好ましい実施の形態において、視覚ルールに 基づいて、レベル1つ1つに対して(または、さらに微細な制御を実行するため にはブロック毎に)、しきい値と視覚感度を設定し、1つのコーディングパス( 優性パス、次に従属パスという具合に)が実行されるステップと; を含む。後者の場合、しきい値は、任意のブロックまたは階層中のゼロツリーの データセットに含まれる最小の絶対振幅係数となる。ゼロツリーアルゴリズムは 、少なくとも現時点のブロックのしきい値の大きさを持つすべての画素を有意の ものとしてコーディングし、スケール、色平面、方位、マスク照度およびマスク ノイズによって人間の視覚感度に基づいて該当するブロックの視覚的寄与を反映 するために十分な精度のビットを送出する。シャピロによって教示される大きさ によって反復ビット平面の探索と分類は実行されない。この新しい方法によって ゼロツリー処理がスピードアップされ、品質が減損する以前に送られることにな っている情報のエントロピーが収縮する。これによって、伝送しなければならな い、シャピロによって必要とされるアドレスデータが消滅する(これと対照的に 、セ ッド(Said)とパールマン(Pearlman)による1993年の回路と システムに関するIEEE国際シンポジウム第1巻の279−282頁の「空間 的方位付けツリーを用いる画像圧縮」(Image Compression Using the Spatial−Orientation Tree)に 示されるアドレスデータを消滅させる状態機械方法を参照)。振幅と無関係にコ ード記号によって完全にラスタされ伝送される最上位のACブロック(かなり小 さい)を必要とすることによって、ゼロツリー中のデータのすべてのツリーが、 埋め込まれた記号のツリーによって取り付けられるマスター先祖を有する。さら に、DCブロック画素はそのそれぞれがフラグを保持し、その画素を表すデータ の3つのACツリーの内のどれもがゼロツリー中では有意でないか否かを示す。 ゼロツリーは、ファンシーなスカラー量子化器と見なすことができる。ゼロツリ ーエントロピー予算が尽きると(低集団・高振幅信号が最適に伝送されると)、 パターン、テクスチャおよびノイズの情報を含む大集団となった低エントロピー 画素が残される。ノイズは、無視すべきでない画像ノイズ(人間の腕にはしみが あるかもしれない)や、スキャナーのノイズ、焦点誤差、非点収差、汚染印刷な どであるかもしれない。 4次元ベクトル量子化器は、次の主たる利点によってゼロツリーの下で機能す ることができる: 1)あらゆるベクトル量子化器でも、あらゆるスカラー量子化器より、低エン トロピーで大量の情報をコンパクトに符号化する際に有利であり、我々は、ベク トル量子化器では圧縮するのが困難な低い個別の集団を持つ多くの高エネルギベ クトルで変換ヒストグラムを汚染する変換全体のための8ビットまたは10ビッ トのデータの代わりに、しきい値未満の最下位ビットを我々のベクトル量子化器 に割り当てるだけである。 2)ベクトル量子化器を用いれば、テクスチャ、パターンそして多分希望次第 ではノイズに対しても最大の寄与を早期に最初に伝送するベクトル量子化器に割 り当てられた最高エネルギベクトルを選択できる。 3)格子または最も近い隣の量子化器を用いれば、サイズを犠牲にして品質を 得たりその逆が可能であるか、その理由は、目に見える歪みはすべてベクトル空 間中にあるからである。ゼロツリーは、ブロックにより可視誤差をその範囲内に 閉じこめるに十分なデータを運び、これによって品質/データサイズ計算を簡略 化している。 4)古典的なベクトル量子化器を用いると、コードブックが発生されるが、こ れによって通常は空間が消耗され、次に、コードブックに対する1ラスタ分の画 像ポインタが、この画像内のあらゆるベクトルに対して生成され、これによって 、そのほとんどが真のノイズであり、したがって、古典的なベクトル量子化器が 、自体がポインタをラスタスキャンするので、ゼロベクトルでさえも伝送するこ とを除いては無視されるような真に低エネルギのベクトルを含む空間がさらに必 要とされる。あるいは、ポインタのラスタを送ることを避ける場合、ゼロベクト ルは完全に無視でき、また、ノイズは統計的に分析されてアルゴリズム的に、必 要であれば受信機で代えられる。完全なラスタを送出することを避けるために最 適な構造がすでに与えられている。したがって、いくつかの記号をゼロツリー構 造に付加して、2x2の子の次のブロックが有意のベクトルポインタを含むこと を1つの記号で有意付けし、これによって、関連の空間的にまばらなベクトルや ゼロツリーに埋め込まれた記号を受信機に送出することができ、また、特定のエ ントロピーで停止することができ、これよって、最上位のものだけを伝送するこ とが可能となる。 5)格子を用いればコードブックを除去する方法が与えられ、これによって画 像エントロピーが減少される。別の利点は、コードブックを用いないと、伝送の 間にコードブックを失ったり腐敗させたりして画像を崩すことができないという 点である。(コードブック中の誤差は、画像中のたった1つのベクトルだけにで はなく、そのコードブックのポインタを共有するすべてのベクトルに広がる。) 格子ベクトル量子化器が高速であると、粗いボロノイ(Voronoi)領域の 中心の近傍にあるオブジェクトがその切り捨てられた値に基づいてランダムに丸 まってしまうので、画像中に傷を引き起こす。まばらな格子が最適でない点があ ればそれは、ベクトル量子化器専用のビット平面上で最も近い隣のコーダを走行 させることによって除去させることができ、これによって、クラスタが画像空間 中に適切に降下する。次に、粗い格子のベクトル量子化器を新たに降下したデー タに適用して、格子の歪みとコードブックに対する必要性を避ける。 ゼロツリー埋め込みされたベクトル記号付きのデュアルベクトル量子化器を付 加したこの改良型の結合ゼロツリーによって、高品質のビデオ画像、医学画像、 セキュリティ画像および静止画像を伝送する際に必要とされる2つの異なるデー タセットを最適にアドレス指定することができる。 図面の簡単な説明 ここで、本発明の好ましい実施の形態を、添付図面を参照して以下に例示目的 だけのために説明する。 図1は、本発明によるデータ圧縮システムのブロック図を示し; 図2aから2cは、1つの画像を3レベルピラミッドたたみ込みを構成する段 階を示す概略図であり; 図3は、圧縮サーチで試験画像として一般的に用いられる「レナ(Lena) 」という題名の8ビットのグレースケールの256x256画素の画像を示し; 図4は、図3の実際の4レベルピラミッドたたみ込みを示し; 図5は、変換済み画像の非DC画素値の典型的なヒストグラムの概略図を示し ; 図6は、ピラミッド型単一パス変換空間のさまざまなブロック内にある画素同 士間の空間的な関係を示し; 図7は、3レベルピラミッド内のツリーを評価する際に用いられる「モルトン スキャン(Morton scan)」のバージョンにおける空間的関係を示し ; 図8は、最下位の2つの階層の各方位上での各軸方向で第2のさざ波パスが実 行された3レベルピラミッド中でデータツリーを形成する画素同士間の水平方向 、直交方向および垂直方向の空間的関係を示し; 図9は、図8に示す変換のモルトンスキャンのパターンとシーケンスを示し; 図10は、ベクトルコーディングの場合は、1つの画像の連続する4つのフレ ームをタイル張りして、4つ全てのクレームに対してたった1つのコードブック を用いてビデオやテレビの画像を圧縮して、変換においてエッジ回りのラップの エントロピー増加への寄与を除去又は大幅に減少する方法を示す。 発明の詳細な説明 本発明に従った不可逆的な画像圧縮システムは概略的に図1中の20で示され る。画像圧縮システム20は:(もし画像28が単色でなければ)より少ない冗 長度の色空間おけるさらなる操作を行なう色変換段階24と;画像を、その冗長 度を容易に利用し得る異なった領域に変換する信号変換処理段階32と;冗長度 が減少されたデータセットにマッピングされる量子化段階36と;減少されたデ ータセットがコンパクト化される無損失のコーディング段階40と格納および/ または変換のために生成される圧縮済みデータの出力44、の4つの段階処理を 含む。 本発明において、圧縮されるカラー画像は最初に、色変換段階24において、 16ビットの(または、医学または工学への用途のために32または64ビット までの)精度計算を用いて、RGB色空間からY−Cr−Cb(照度および対角 線Cr、Cb色差)色空間へ変換されることが好ましい。一方、圧縮はRGB色 空間内の画像に行なうことができ、この色空間は厳格に冗長かつ非直交である。 本発明の好ましい実施の形態において、RGB色空間よりもより冗長度が少なく 、人間の視覚システムが利用する色相−彩度−輝度(HSB)色空間により近い ので、Y−Cr−Cb色空間が利用される。これによって、画像のための特有の 色空間がRGB色空間よりもより少ないビット情報で表わすことが可能となる。 例として、RGB色空間における赤、緑および青の各8ビットの平面が与える色 解像度に近い色解像度を有するY−Cr−Cb色空間内の画像を表現するには、 輝度(Y)平面内の5ビットおよび各3ビットの色差平面(CrおよびCb)で 十分である。 例えば、壁が任意の色の純粋な顔料で塗られ単一タイプの光源で不均一に照ら されていれば、RGB色空間における壁の画像内の全ての画素は、輝度が変化す るにつれて異なる赤、緑および青の値を有する。実際、グレイのすべてのシェー ドを通り黒から白色までの、且つゆえに「色」成分を全く有しないシェードで塗 られた壁のRGB色空間内の画像でも尚、画素ごとに変化する赤、緑および青の 各々の値を有している。しかしながら、壁の画像がHSB色空間内にあれば、す べての点の色相および彩度の値は同一になり輝度の値のみが照度により変化する 。一方、より非直感的ではあるが類似の結果がY−Cr−Cb色空間内で起こる 。したがって、各色空間の導関数を取ると、照度平面のみが比較的高い振幅のデ ータとして残り、こうしてより良い圧縮を達成することができる。 当業者にとって明らかなように、Y−Cr−Cb色空間に比較してやや冗長度 が増し故にやや満足度に欠ける圧縮結果をもたらすけれども、NTSC色空間( YIQ)またはPAL/SECAM色空間(YUV)をY−Cr−Cb色空間の 代わりに用いることが出来る。本発明において、単色の画像は照度(Y)色平面 として直接的に扱われる。 本発明者は、商業用/消費者用の画像応用のための好ましい実施の形態におい て、画像データ28上における色平面毎の完全な8ビットRGB再構成のために は、以下に述べるように、色変換段階24における係数のために16ビットのお よび符号処理段階32における画像毎に12ビットの解像度があれば充分である と決定した。ここで用いられるように、完全な8ビットの色は、再構成されると 色情報の元の8ビットが生じる、すなわち、どんな誤差も整数部より小さくなる ので不正確な丸めをもたらさないということを意味する。さらに、色変換段階2 4におけるステップの1つとして、再構成が較正できるように以下の色統計を含 むレコードが作られる:画像空間の各直交平面(Y,CrおよびCb)における 平均、最大値、および最小値。圧縮済みデータ44がデータ画像28の容認し得 る近似にまで再構成されると、再構成された画像の色および輝度の平均値は(Y −Cr−Cb色空間において)ヒストグラムシフトによって未圧縮のデータ画像 28のそれらに再び突合せさせることができ、色および輝度の極値は、ヒストグ ラムを中心の各側に引き延ばすことによって、記録された最大値に突合せさせる ことが出来る、ということが当業者には理解されるだろう。 本発明者は、色空間統計の再突合わせによるこの較正が、動画ビデオ画像が圧 縮、再構成されている際にとりわけ有効であると確信する。 とりわけ、輝度が色差から分離され、輝度の平均値および極値が再突合せされ 、色のドリフトが彩度近傍に限定されるので、(輝度および色差のちらつきをも たらす)量子化のフレーム毎の変化は低減することができるかまたは回避するこ とができる。 色変換段階24を遂行するために適切な技法はよく知られており、とりわけC CIR標準マトリクスを含む。本発明者によって現在選択されている変換は、R GBのY−Cr−Cbへの転換のための標準変換マトリクスを含み、Y−Cr− CbのRGBへの転換のための高精度逆マトリクスを含む。 具体的には、現在の好ましいRGBのY−Cr−Cbへの変換は: Y =round{(0.299×R)+(0.587×G)+(0.114 ×B)} Cr=round{(0.500×R)−(0.419×G)−(0.081 ×B)+128} Cb−round{(−0.169×R)−(0.331×G)+(0.50 0×B)+128} である。また好ましい逆変換は: R=round{Y+(1.40168676×(Cr−128))−(0. 00092674×(Cb−128))} G=round{Y−(0.71416904×(Cr−128))−(0. 34369538×(Cb−128))} B=round{Y+(0.00099072×(Cr−128))+(1. 77216042×(Cb−128))} であり、各色平面の範囲は合理的な整数値内(すなわち、0−255)にとどま るようにする。 本発明者は、もしエントロピーコーダの前に量子化プロセスが行なわれなけれ ば、変換マトリクスのこの組合わせは、色空間転換の8ビット整数の完全な再構 成を可能にする、と決定した。当業者にとって明らかなように、Y−Cr−Cb のRGBへの上述の変換は拡張された精度の値を利用するので、従来技術の8ビ ット変換よりも多くのメモリおよび処理時間を必要とする。しかしながら、本発 明者は、この変換が、米国特許第5,416,614号において開示されその内 容は参照されてここに組込まれ、そうでない場合にはメモリの要求を低減するた めに用いられる方法のような、色空間変換制御の「スマート」方式よりも速いと 決定した。そうではあるが、例えばメモリコストが処理速度における有利さを超 えるような環境下においては、そのような「スマート」方式または他の同等な方 式を本発明において用いることが出来る、ということは当業者にとって明らかで あろう。 システム20において、画像28が適切な色空間に(もし必要ならば)変換さ れた後、次に信号処理段階32が、画像データを元の画像空間からさざ波濾過変 換を伴なう所望の変換空間に変換する。本発明者は、以下の判断基準に基づいて 適切なフィルタを選択した: 1)必要とされる再構成の属性、すなわち、完全か、または完全に近いか; ii)直交性、または双直交性の属性; iii)位相における対称性の度合い(大きな対称性は、より小さな量子化ノ イズ、および量子化されたエッジにおけるより小さな位相誤差に帰結する); iv)低いサイドローブ高(低いサイドローブ高は、停止帯のノイズ要因の低 減をもたらし、S/N比を改善する); v)フィルタの長さ(フィルタが長くなればなるほど計算時間は長くなるがそ の結果得られるデータは滑らかになる); vi)データ圧縮特性(長さ、消失時の数、および係数値に関連する。ピクチ ャ内の所定の高さのオブジェクトのエッジによる非−ゼロ画素内に、どのぐらい のエネルギーが存在するか。フィルタがより長くなれば、非−ゼロ項目はより多 くなる); vii)次元(2つのIDさざ波対1つの2D「五つ目型または六角形のさざ 波」、ゼロツリーのための2:1のサブサンプリングピラミッドの必要性は、2 つのIDさざ波を必要とする); viii)さざ波フィルタの各方向における単一パスまたは二重パス(ピラミ ッドの大きなサブバンドにおける第2のさざ波のパスは、より多くの処理と引換 えにエントロピーを低下させる)。 本発明の現在の好ましい実施の形態において、信号処理段階32は:近線形位 相を伴なう完全再構成・直角位相ミラーフィルタ(PR−QMF);または線形 位相を伴なう対称近完全再構成・直角位相ミラーフィルタ(Near−PR−Q MF)、または(低パスおよび高パスのための2つの異なる長さの対称フィルタ を用いたPR−QMFである)二重直交性さざ波変換、のどれかを用いる。本発 明の他の実施の形態において、処理の減少が重要である場合(すなわち、プロセ ッサに拘束されたシステムにおいて)、また非常に短いハール変換を有利に用い ることが意図される。 適切なフィルタの実際の構成は:ドーバチーズ(Ingrid Daubec hies)による「さざ波についての10の講義」の中の「圧縮支持されたさざ 波の基礎に対する対称」SIAM、1992、8章251頁および287頁;ケ ンブリッジ大学出版のプレス(W.H.Press)、チューコルスキー(S. A.Teukolsky)、ベターリング(B.P.Vetterling)、 フラナリー(B.P.Flannery)による「Cにおける数値的手法−サイ エンティフィック・コンピューティングの技術、第2版」591−606頁;K luwer Academic Publisherのヤング(Randy K .Young)による「さざ波技法およびその応用」;Jones and B artlett、Mary Beth Ruskai、Editorによる「さ ざ波およびその応用」;およびIEEE画像処理についての報告書の第1巻No .2のアントニーニ(Antonini)、バーロード(Barlaud)、マ シュー(Mathieu)およびドーバチーズ(Daubechies)による 「さざ波変換を用いた画像の符号化」1992年4月、205−220頁、に記 述されており、その各内容は参照してここに組込まれる。 上述したように、適切なフィルタの選択は、完全な再構成が重要か否か、どの ぐらい多くの量子化が行なわれるか、ノイズの比率に対するワーストケース信号 、計算の複雑性、等に基づく。これらの判断基準は用途によって変化しうるので 、所定の用途のための特定のフィルタセットを、利用できるフィルタセットのリ ストから選択するために、使用者入力のまたは用途固有のスイッチをシステム2 0内に備えることができるように、意図される。 さざ波濾過の用途のいくぶん単純化された記述が、添付付録Aを参照して以下 に示される。画像圧縮のシステムにおいては、画像は、画像データIの非希薄な マトリクスであると仮定され、ディジタルフィルタ項目LおよびH(低パスおよ び高パスフィルタの係数)の希薄な対角マトリクスWであるさざ波によって濾過 され(畳込まれ)、繰返し、しかしフィルタのタイプによって決定されるパター ン内の連続する各線上でオフセットされる。それゆえ、別個の処理は、同時に画 像「マトリクス」Iの1つの列上での、正方、希薄、対角マトリクスWのマトリ クス乗算操作と考えることができる。マトリクスWはその列の高さと同じ次元を 持つ。その結果生じる中間マトリクスT’の行および列は交換され、新しい列の 高さの次元をもつ正方、希薄マトリクスW’がT’の各列上に作用する。 生じたマトリクスの行および列はそれから再び交換され、その結果低エネルギ ー変換マトリクスTが生じる。その操作それ自体は厳密に言えばマトリクスの乗 算ではないかもしれないが、しかしこれは一般的な手順である。(2重直交性の さざ波のような)あるさざ波構造に対しては、純粋なマトリクス乗算操作よりも 実質的により複雑な処理がなされ、リストアップされた参照におけるアルゴリズ ムはこれらのさざ波フィルタの生成および操作を記述する。付録Aに示されるマ トリクス表記法において、第1のインデックスは最上段の行について最も低いイ ンデックス値をもつ行のインデックスであり、第2のインデックスは、最も低い 値をもつ一番左の列のインデックスである。 さざ波フィルタの操作の一例が以下に示され、そこではドーバチーズ(Dau bechies)の離散4要素D4さざ波が用いられる。その結果生じる、画像 の行パスのための変換マトリクスTは、画像内の各列にフィルタマトリクスを掛 けることによって遂行される。さざ波マトリクスは常に正方行列である。明らか なように、フィルタマトリクスの各軸の中には、画像の行内にある画素値と同じ くらい多くの要素(全てのゼロ要素を含む)が存在する。(列パスのためには、 さざ波マトリクスは、画像の列の高さと同じ程度の幅および高さを有する。)さ ざ波マトリクスの上半分(低パスフィルタの半分)連続する行の各々は、前記の 行を右に2要素分回転シフトしたものに一致する。 さざ波マトリクスの下半分は、一番左のマトリクス位置から出発して上半分に 似ているが、その要素は今度は高パスフィルタの係数である。したがって、変換 マトリクスTの行内には、元の画像内にある画素の半分の数の低パス(または高 パス)画素があるのみである。このことは、各行の2つによるデシメーションを もたらす。低パス(および高パス)の終りに、この例におけるさざ波の非ゼロ要 素がマトリクスに巻き付く。対称フィルタにおいては、巻付きは低パスまたは高 パスのそれぞれの終りで起こる。量子化のあいだのエッジの歪みを最小化するた めにさざ波を終了させる他の方法がさらに論じられる。 明らかなように、画像は正方である必要はないが、画像の各軸内の画素の数は 、掛ける整数が少なくとも、用いられる特定のさざ波内の非ゼロ要素の最大スパ ンと同じくらいの大きさで、変換内のさざ波の階層(レベル)の数の累乗に対し て2の整数倍でなければならない。例として、4要素ドーバチーズD4フィルタ マトリクスおよびN×N画像を用いると、変換画素は以下の操作によってもたら される: T[u,v]=W[v,1]×I[u,1]+W[v,2]×I[u,2]+ W[v,3]×I[u,3]+……+W[v,N]×I[u,N] ここで、積W×Iのほとんどはゼロになり、したがって変換画素T[2,4] に対しては: T[2,4]=W[4,1]×I[2,1]+W[4,2]×I[2,2]+ ……+W[4,N−1]×I[2,N−1]+W[4,N]×I[2,N] =W[4,3]×I[2,3]+W[4,4]×I[2,4] +W[4,5]×I[2,5]+W[4,6]×I[2,6] となる。 列のパスがまた実行されると、低パス“DC”画像は生じたマトリクスTの上 左象限に存在する。フィルタマトリクスWに巻付くのが見える要素は、画像の行 の他の端において画素を増大させる。これは一般には画像の周期的拡張としてよ ばれ、非類似の逆画像の境界線に起因する、変換における希望しない高い値の画 素をもたらす。 濾過操作の単純な丸めに起因する境界アーチファクトを防ぐために、画像のエ ッジにおける上述した巻付き(すなわち、周期的拡張)、エッジ画素値をフィル タ幅の半分の2倍だけレベル数に継ぎ足すこと(すなわち、充填)、または設定 された画素数についてそのエッジ画素値を映すこと(すなわち、対称的拡張)、 を含むさまざまな技法が開発されている。当業者にとって明らかなように、用い られる特定の技法の成功は、ある程度、用いられるさざなみのタイプに依存する 。 一般に、周期的な拡張に伴なう問題は画像のエッジにおける高いさざ波ドメイ ン値をもたらす、なぜならば、画像の左の(または上端の)エッジは右の(また は下端の)エッジに整合しにくく、したがって導関数は画像のエッジにおいて大 きなパルスとなるからである。このパルスは、誤差ではなくむしろ可逆的な(潜 在的に完全な)フィルタ処理の帰結であるので、無視できない。残念なことに、 画像のエッジにおける良い画像の質が求められているのであれば、そうしたパル ス(高い画素値)は無視できなく、したがって画像データのエントロピーの増大 をもたらし、それは画像データの高い圧縮率を得ることを困難にするので、望ま しくない。 充填および対照的拡張の双方とも、わずかに少なく増幅された境界画素値にて こずるが、もしピクチャのエッジにおける勾配が急であれば、そのときは突然の 逆転(対照的拡張)がなお境界パルスを与える。充填はしはしば類似のしかしよ り小さなパルスをもたらす。 境界アーチファクトを低減するための前記の技法が本発明において用いられる 一方で、本発明者は、目下好ましい以下の技法を開発した。具体的には、現在の 画像の境界は、固定した画素幅の「フレーム」によって4辺のすべてに延びてい る。このフレームは、すべての軸における最終的さざなみパスのために、各画像 の次元に加えられる充填画素の数が少なくともさざなみが用いられるのと同程度 であるぐらい十分に大きい。この境界帯域内の画素は、元の画像のエッジ画素値 から色平面の中点に等しい値まで滑らかに変化する値を与えられる。元の画像の エッジにおいて、勾配は、もし可能ならば、50%の値をもつ新しい画像のエッ ジにおける0勾配に整合され、なめらかに水準化される。コーナーの画素は50 %に平滑化された勾配の90度の弧をもつ、または代わりに、境界における勾配 は両方向に対して平滑化される。この結果生じる拡大されたフレームの画像にお いて、前記の周期的拡張の技法が、エッジにおける大きなパルスを伴なうことな く、また元の画像の情報を損失することなく、利用できる。 最小フレーム幅は、最後のさざ波レベルが、両エッジ間で滑らかに変動する混 合物上でなお作用しなければならないという要請によって決定される。しかしな がら、十分な数のさざ波レベルについて、最後のレベルにおける潜在的に高い値 の変換エッジ画素の数が少ないので、この要求はいくぶん和らげられる、という ことが当業者にとって明らかになるだろう。標準的なスカラーまたはベクトル量 子化を利用するデータ圧縮システムにおいて、余分なデータの「太った」境界を 付加することは、伝送されたデータの流れを膨張させる、ということが当業者に とってまた明らかである。しかしながら、以下により詳細に論ぜられるように、 本発明は、(ピクチャ内のオブジェクトの全てのエッジの)エッジ情報を表現す る比較的数が少なく高い値の変換要素のためのゼロツリータイプの量子化、およ びテキスチャおよびパターン情報を表現する比較的数の多い低い値の変換要素の ためのベクトル量子化器を利用する。したがって、変換ドメイン内において大き な振幅を持つ付加境界データはほとんどないので、それはゼロツリー量子化器か ら消滅し、またこの新しい(滑らかな)境界データ内にテキスチャがほとんどな いので、そのほとんどはまた、低ビットの平面に適用されるベクトル量子化器に よって処理される必要がない。ここで開示される技法を用いて、従来技術による 処理よりもはるかに高くない値のデータを伝送されたストリームに付加すること が意図される。 ピクチャの境界近傍のさざなみフィルタ係数を取扱う他の解決法がまた知られ ており、それはICASSPのデプレッツ(Francols Deprez) 、リウル(Oliver Rioul)、ドゥハメル(Pierre Duha mel)による「有限長信号のサブバンド処理のための境界回復」1994、第 III巻、133−136頁の中で説かれている方法であり、その内容は参照して ここに組込まれる。フィルタ係数に変更を加えてその出力を低減することを通常 アポダイゼイションという。しかしながら、ほとんどのフィルタアポダイゼイシ ョン方式はいくつかのエッジデータを処理するかまたは、付加的な処理のかなり の量を含む。 画像のエッジを扱うための周知の技法のいくつかは:Personal Co mmunicationのフリードマン(Michael H.Freedma n)、プレス(William H.Press)による「さざ波マトリクスの 丸め:トポロジー制御のエッジ効果および低減」1992年12月プレプリント ;ICASSPのオヘア(John R.O’hair)、シューター(Bru ce W.Suter)による「ベールキン−コーフマン−ロクリン変換におけ る歪みの除去」1993年、第3巻、324−327頁;およびICASSPの クウェイロツ(Ricardo L.de Queiroz)による「境界の歪 みを伴なわない有限長信号のサブバンド処理」1992年、第4巻、613−6 16頁、の中で論じられているが、その内容は参照してここに組み込まれる。 上記のように、発明の現在の好ましい実施の形態において、一次元のさざ波フ ィルタが、各軸において2:1のサブサンプリング法を用いて、画像データ上の 2つの方向(水平および垂直方向)のそれぞれで連続的に用いられる。その結果 生じる画像変換は4つの象限からなるが、画素に関しては同じサイズのままであ る。そのような3つのレベルの画像変換を構成する例が、図2aから図2cに概 略的に示される。この議論において、象限の識別名の第1の文字は、水平方向に おけるフィルタ操作のタイプを表し(すなわち、Lは低パスを、Hは高パスを表 す)、第2の文字は、垂直方向におけるフィルタ操作のタイプを表し、数値は濾 過のサイズ(階層)を表す。 図2aは変換の第1レベルの結果を概略的に示し、そこにおいて:左上のブロ ック(LL0)は、水平および垂直方向の低パス濾過の後に両方向における2に よるデシメーションの結果生じたもので、DC項目を表す:右上のブロック(H L0)は、高パス水平方向濾過および低パス垂直方向濾過の後に2によるデシメ ーションの結果生じたものであり:左下のブロック(LH0)は、低パス水平方 向濾過および高パス垂直方向濾過の後に2によるデシメーションの結果生じたも のであり:右下のブロックは、両方向の高パス濾過の後に再び両方向での2によ るデシメーションの結果生じたものである。その結果生じるブロックLL0にお けるDC画像は、元の画像に類似しているように見えるが、デシメーションのた めに両方向にちょうど50%分大きさが小さくなっている。 図2bは変換の第2レベルを概略的に示し、そこにおいてブロックHL0,L H0およびHH0は上と同様であり、ブロックLL0はさらに:垂直および水平 方向低パス濾過およびブロックLL0の両方向での2によるデシメーションの結 果からのDC項であるLL1、LL0の高パス水平方向および低パス垂直方向濾 過の後の2によるデシメーションの結果であるHL1、LL0の低パス水平方向 および高パス垂直方向濾過の後の2によるデシメーションの結果であるLH1、 およびLL0の両方向の高パス濾過の後の、再び両方向での2によるデシメーシ ョンの結果であるHH1に変換された。その結果生じたブロックLL1における 新しいDC画像はもとの画像に類似しているように見えるが、両方向での2重の 2によるデシメーションのために両方向で元のサイズの4分の1の大きさになっ ている。 図2cは変換の第3のレベルを概略的に示し、そこにおいてHL1,LH1, HH1,HL0,LH0およびHH0は前記と同様であり、ブロックLL1は前 記LL0と同様のやり方で変換されて、ブロックLL2,LH2,HL2,およ びHH2を得た。 一般に、このような変換操作から生じる4象限構造を「さざ波ピラミッド」ま たは「たたみ込みピラミッド」とみなされ、図2cの例は、3レベルのピラミッ ドである。左上におけるDC項目以外のさざ波変換のブロックは、ACブロック と呼ばれ、そのレベルはACレベルとみなされる。DCブロックを直接取囲む3 つのACブロックは最高ACレベルと呼ばれる。明らかなように、4レベル以上 のピラミッドは、同様にして、追加的な変換操作を行なうことによって、望むよ うに、得ることが出来る。 図3は、通常、画像圧縮の学習用に用いられ、「レナ(Lena)」と呼ばれ るディジタルテスト画像を示し、図4は、「レナ」の画像の4レベルさざ波変換 から生じた4レベルピラミッドを示す。 ひとたびピラミッドレベルの希望する数が処理されると、変換データの量子化 を進行させることが可能となる。しかしながら、ピラミッドの最も大きいACブ ロックを両方向において再濾過し、さらに厳密な量子化によるよりもむしろこの 無損失処理でエントロピーを低下させることは、有益である。量子化が不可能で ある完全な再構成技法にとって、これは有効であり、図8を参照しながら、さら に以下に論じられる。 ピラミッドのたたみ込みのさらなる議論が:IEEE Computer S ociety Workshop on Computer Visionの議 事録のマラット(Stephane G.Mallat)による「簡潔な多重分 解の表現:さざ波モデル」1987年11月30日−12月2日、2−7頁;I EEE画像処理についての報告書のルイス(A.S.Lewis)、ノールズ( G.K.Knowles)による「2Dさざ波変換を用いた画像圧縮」第1巻N o.2、1992年、244−250頁;IEEE通信についての報告書のバー ト(P.J.Burt)、アデルスン(E.H.Adelson)による「コン パクト画像コードとしてのラプラスピラミッド」第3巻No.4、1983年、 532−540頁、の中に見ることができ、各内容は参照してここに組み込まれ る。 本発明者は、ピラミッドの表現は画像データのエントロピーを低下させるため の合理的な構造を与え、またPR−QMFを用いると、ピラミッド処理それ自体 は、再構成された画像の質に影響を及ぼさないと信じている。 「無損失」圧縮の3つのレベルがここに論じられる。第1のレベルは周知の人 間の視覚の特性に基づき、「視覚的無損失圧縮」とよばれる。 視覚的無損失圧縮においては、再構成された近似的画像は、その違いを人間の 目が知覚できないほど、元の画像に十分正確に近似している。これとは異なり、 無損失圧縮の第2レベルは「統計的無損失圧縮」とよばれ、そこでは元の画像と 再構成された近似画像のあいだの差は、画像内の空間的局所的ノイズよりも特定 の量だけ小さい。第3のレベルは真の無損失圧縮であり、そこでは全てのデータ が、元の指定されたビットデプスにまで完全に回復される。 最後の基準は、無限に正確な再構成は不可能であるから逆の処理の結果を丸め ることで指定された正確さで「正確な元のデータ」を回復するように、元のデー タ表現の望まれる正確さの厳密な定義に依存する。 本発明者は、視覚システムの挙動に基づくエントロピーの低減(圧縮)は、離 散コサイン変換(DCT)を用いる前記のJPEGまたはMPEG基準において は容易に達成できないと判断したのであるか、それらは人間の視覚の対数スケー ル空間を有せず、また様々な周波数の空間的な位置づけも表現しないからである 。 反対に、廃棄目的での視覚的に認識できないまたは冗長なデータ解析における ピラミッドたたみ込み構造の使用は、輝度コントラストマスキング、色差の輝度 マスキング、スケール−しきい値マスキング、スケールパターンマスキング、エ ッジマスキング、ノイズマスキング、および運動、加速、ちらつきマスキングの 様々な形態、に拡張することができる。 マスキングの諸問題および人間の視覚システムの諸特性の叙述のいくつかが、 ワトソン(Andrew Watson)およびマール(David Marr )の以下の出版物の中で取り上げられている:W.H.Freeman and Companyのマールによる「視覚:視覚情報の人間的表現および処理につ いての計算に関する研究」1982年;Marcel Dekker Inc. のケリー(D.H.Kelly)、編集者による視覚科学および工学−モデルお よび応用」1994年;MIT出版のワトソン(Andrew B.Watos on)、編集者による「ディジタル画像および人間の視覚」A Bradfor d Book、1993年;およびJournal of the Optic al Society of Americaのワトソンによる「規範となる人 間画像コードの効率」A、1987年、2401−2417頁。各内容は参照し てここに組込まれる。 上述のたたみ込みピラミッドを得るための画像のさざ波分解の後、無損失コー ダを用いた変換の各色平面内のDCブロックを処理することによって、信号処理 段階32が完了する。具体的には、各色平面内のDCブロックについて、信号処 理段階32は、ブロックの第1列には元のDC値を残しておいて、一度にDCブ ロックの1つの行をデルタコーディングする。全ての行がコーディングされたと き、ブロックの左上端の画素だけがコーディングされないで残されたまま、DC ブロックの第1列が、デルタコーディングされる。デルタコーディングとは、画 素値が、その値とそれと所定の関係にある別の画素値とのあいだの差によって置 き換えられることを意味する。例えば、各行の一番右の画素から出発して、(第 1の画素を除いて)行内の各画素毎に、その値が、そのDC値とその左の画素の DC値とのあいだの差によって置き換えられる。同様に、第1列のデルタコーデ ィングとは、(最上端の1つを除く)列内の各画素毎に、下端から始めて、その 値が、そのDC値とその上の画素のDC値とのあいだの差によって置き換えられ ることを意味する。最初に行を、そして残っているDC列をデルタコーディング することによって、その処理は下の次の行の前部に巻付く(それは上述したさざ 波エッジ効果に類似した、望まれないピクチャエッジのスパイクをもたらす)こ とがないので、高い値のデルタコードの数が最小化される。デルタコーディング がいま好ましいが、本発明はデルタコーディングに限定されるものではなく、も し望まれれば、あらゆる他の適切な無損失コーディングの技法を用いてもよい。 ひとたび、1つの画像について信号処理段階32が完了すると、量子化段階3 6および/またはエントロピーコーディング段階40が開始される。 当業者にとって明らかなように、多重画像(ビデオ、等)は、データ圧縮シス テム20の段階24,32、36および40を通してパイプラインされることが でき、処理量および処理能率を増大させる。このパイプライン化は並列的および /または直列的に行なうことができる。多重画像は並列処理において、同時にタ イリングされ、処理され得る。このことは、1)いくつかの画像は他のものより より圧縮されにくいかもしれない、ゆえにグループとしては最も悪い要素よりも 常に容易に圧縮できる;2)インターフレーム圧縮から利益をこうむることがで きるビデオの画像が、シーン転換におけるエントロピーの飛越しをもたらし、そ のために、ほとんどのチャネルがあらゆる1つのフレームにおいても同時にシー ンを変えることがないので、動画チャネルのモザイクがより小さいエントロピー の飛越しに帰結する;3)より大きな画像が、通常より高い量子化器の効率をも たらすことができるより大きな統計的ベースの役に立つ;および4)もし、イン ターフレームコーディングの代わりに、1つのビデオシーンの中のいくつかのフ レームに、タイリングがあれば、その結果生じたより大きい画像のあいだでコー ドブックを分け合うことが可能となり、受け手は、比較のために利用できるブラ ケティングフレームをもつので、中間のフレームにおけるデータの脱落を補完す ることができる、という有利さをもつ。そのような処理に対して、水平方向およ び垂直方向のカウンターパート(図10)の「鏡」として配置される2x2の連 続的画像が、特別なエッジ処理の必要性を取り除くことがいま意図される。なぜ なら、典型的な運動についてビデオが共通のエッジに沿ってまたは4つのフレー ム間の巻付きの外側で急速に変化することはほとんどないからである。 もしハードウェアが用いられれば、さまざまな段階を連続的に(直列に)パイ プラインされることがでるので、フレームnが段階40にある一方で、フレーム n+1は段階36にあり、フレームn+2は段階32にあり、フレームn+3は 段階24にある。この計画は多くのメモリを浪費するかもしれない一方で、それ はあらゆる特定のフレームレートのためのより遅い成分をも処理することを可能 にする。なぜなら最も遅い処理が、処理の全体のシーケンスの代わりに、レート 決定のステップになるからである。 圧縮処理の、システム20におけるこの時点において、2つの異なる圧縮行先 が用いられてもよい。具体的には、最小品質限界判断基準が用いられてもよいし 、または最大サイズ限界判断基準が用いられてもよい。この時点でこれら2つの 判断基準の選択が使用者に与えられてもよいし、またはシステム20に対して、 選択があらかじめ適切に決められてもよいことが意図される。どちらの場合にも 、量子化段階36が働いて、以下に述べられるように、これら2つの判断基準の 一方を満足する。 1つのテレビチャネルまたは1つの単一フロッピーディスクのような、固定し た帯域幅が与えられると、その結果生じた圧縮データ出力44に対して最大サイ ズ限界が指定され、それに従って量子化段階36が作動し、こうして圧縮データ 出力44から再構成された画像の質が変化する。医学画像や大スクリーン映画な どについては、最小許容品質レベルが量子化段階36に対して指定することがで き、圧縮データ出力44の大きさが画像エントロピーによって変動するが、圧縮 データ出力44から再構成された画像の質は(圧縮仕様においてどのような品質 測定基準が用いられても)常に少なくとも指定された品質である。 さざ波変換は、さざ波のタイプに基づいて、指定の再構成品質を有する高パス /低パスフィルターの対に関して、考察することができる。同様に、さざ波変換 は、微分器/積分器の対とみなすことができる。さざ波変換において、高パス、 即ち微分器、成分は、離散さざ波変換(DWT)の処理方向に関して色平面値の 変化率を与える。DWTは視覚エッジ、すなわち輝度色空間におけるエッジに交 差するので、画像において暗くなるまたは明るくなる率は増大し、DWT画素値 はそれに対応して変化する。 本発明者は、このことが変換のAC部における高い値の全ての画素を増大させ 、このデータは、画像内のオブジェクトの「エッジ」データを実質的に表す、と 決定した。 画像変換をモデル化するための多くの数学的アプローチは、ビットを様々なブ ロックに(ラグランジュまたはKTTの方法を適用して)適切に割当てるための 最良の曲線あてはめ方程式の利用を意図する、単一の数学的実態としての、ヒス トグラム曲線のあてはめ、を含む。 本発明者は、変換の輝度平面において、変換のACブロック内の比較的に低い 値(正または負)の画素のいくつかは、画像内部のオブジェクトのエッジ近傍で おこる「ランバート」輝度のロールオフによってもたらされると決定した。した がってこれらの低い値の画素は、人間の目が小さな変動を感知できる滑らかに変 化する陰影を構成するので、量子化ノイズに敏感である。しかしながら、そのよ うな低い値の画素の大部分は、より大きいノイズを許容できる画像におけるテキ スチャまたはパターンを表している。なぜならテキスチャまたはパターンは近傍 の画素との容易な比較を覆い隠すからである。 このように、ヒストグラムは実際は、2つの重ね合わされた曲線、1方は三次 元オブジェクトの輝度、他方はパターン、テキスチャおよびノイズの関数の結果 である。 したがって、ノイズまたは量子化誤差に同じように感応せず集団のサイズにお いて異なる、2つの別個のデータセットが存在するので、それらは、1つの量子 化のスキームまたは品質基準によって処理される1つのセットとして効率的に扱 うことができない、と本発明者は考える。 図5は、画像のさざ波変換の高パス部分における画素値の典型的なヒストグラ ム100を示す。ゼロ近傍を中心とする中央の(ラプラス型の)スパイク104 は、画像におけるテキスチャおよびパターン情報を表し、一方より浅くより広い (ガウス型の)プラトー112は、画像内の現実のオブジェクトの(形状の情報 を与える)エッジに空間的に接近した前記の「エッジ」および情報を表す。明ら かなように、画素値の大部分はスパイク104内に置かれ、比較的小数はプラト ー112内に見られる。 変換のAC部分における正および負の高い振幅の画素は、画像内のオブジェク トのエッジを示す輝度または色の突然の変化を伴なう。高い振幅のエッジは、目 の対数的反応のために、低い振幅のエッジよりもより大きい誤差を隠すことがで きる。 (非視覚的なアーチファクトまたは少なくとも非視覚的に不快なアーチファク トを得る)容認できる画像の質を達成するために、図5の曲線における異種の情 報が、画像データの量および再構成された画像の劣化を低減するようなやりかた で量子化されなければならない、と本発明者は判断した。人間の目はパターンに ついてより敏感なので、テキスチャの輝度変化はパターンよりもより厳しく量子 化することができ、一方テキスチャおよびパターンは両方とも、滑らかな形状の 変化よりもより厳しく量子化することができる。したがって、これは(少なくと も)量子化器の2つの異なるタイプおよび正確さを必要とする、と本発明者は判 断した。 予知戦略、クラスタリング方法、実行モデル、エラーノルムなどの値を変更す る際に利用可能な量子化方法はいくつかあるが、このような量子化システムの最 も基本的な相違は次元の数である。この分類はさらに次の2つのタイプに分けら れる:参照してここに組み込まれる、ゲルショ(Allen Gersho)、 グレイ(Robert Gray)によるKluwer Academic P ublishersの第5章、6章および7章の「ベクトル量子化と信号圧縮」 (Vector Quantlzation and Signal Comp ression)やグレイ(Robert M.Gray)によるKluwer Academic Publisherの「ソースコーデイング理論」(So urce Coding Theory)に教示されているスカラー量子化と; 上述のグレイが参照し、これまた参照してここに組み込まれる、IEEEプ レス社のHuseyin Abut編集者の「ベクトル量子化」(Vector Quantization)の第10章から17章で教示されているような、 1連の又はブロックの画素(ベクトル)が量子化されるベクトル量子化である。 プラトー112中のオブジェクトエッジ情報画素の比較的小さい集団によって カバーされる値の範囲が比較的大きく、また、これらのオブジェクトエッジ近傍 の低振幅の画素の勾配の重要性のために、均一なスカラー量子化器を持つ画像を 量子化する場合に良好な結果を得ることが困難である。この原因は、スカラー量 子化器のステップのサイズが、画素1つ当たり数ビットしか持たないオブジェク トエッジ中の値の範囲を再現するに十分大きい場合、その大きなステップサイズ によって、平滑に変化する低振幅形状データ近傍エッジ中に目に見える歪みが引 き起こされる。さらにまた、スカラー量子化器のステップサイズが大きいと、大 きなステップサイズの選択によって引き起こされたゼロの回りの不感帯のために 、スパイク104中の画素に埋め込まれたあらゆる低振幅パターンおよび/また はテクスチャの情報が「平坦化」される。 他方、スカラー量子化器が、パターンおよび/またはテクスチャデータを適切 にカバーするに十分小さいステップサイズを有する場合、必要とされる微細なス テップの範囲が大きいため圧縮はほとんどなされない。量子化器中のゼロ点の回 りのヌル応答ゾーンである不感帯がエントロピーを減少させるためにスカラー量 子化器内で拡幅されると、たとえ拡幅された不感帯の外側のステップサイズが比 較的小さい場合でさえも、追加のパターンおよび/またはテクスチャの情報は失 われてしまう。 不均一なスカラー量子化器が、より大きな振幅に適したより大きなステップサ イズを有するオブジェクトエッジでのエントロピーを減少させる間は、このよう な量子化器はスパイク104中のデータに対して小さなステップを与え、これに よって平滑なエッジ近傍の「傷」を最小化し、また、テクスチャおよび/または パターンを示す必要がある。これは不運なことに、比較的大きな集団の低振幅デ ータに高い精度が与えられる結果となり、従って、比較的少ないオブジェクトエ ッジ画素のための大きなステップサイズによるエントロピー減少がスパイク10 4のエントロピーによって圧倒されてしまう。 当業者には理解されるように、ベクトル量子化器は、たとえコードブックがま ばらでも、少数の典型的なベクトルはパターンまたはテクスチャを充填すること が可能なので、テクスチャおよび/またはパターンの情報を非常に良好に維持す る。しかしながら、プラトー112中の画素値の範囲が比較的大きいために、こ れら高振幅値を収容するためにベクトル量子化器が必要とする「コードブック」 は容認不可能なほどに大きくなり、このため、圧縮器としてのその有用性が減少 する。例えば、1ベクトル当たり15レベルと4画素を用いる比較的低品質の均 一ベクトル量子化器は、完全なベクトル空間を充填するには154=50,62 5個のベクトルを必要とする。このため、4画素から成るベクトル1つ当たり1 6ビットポインタが1つ必要となり、この結果、エントロピーコーディング以前 の圧縮比率はたった2:1(8ビット画素と仮定して)となる。さらに、15グ レイレベルの画像は、たとえ量子化プロセスが変換空間中で発生しても、特に平 滑ということはない。画像圧縮に対する、1画素当たり33レベルのより現実的 で容認可能な均一ベクトル量子化器は、1ベクトル当たり21ビットすなわち1 画素当たり5.25ビット必要であり、エントロピーコーディング以前の圧縮比 率はたった1.5:1となるだけである。 ベクトル量子化に関する上記の説明は、任意の画像の高品質圧縮についての基 本的な問題をより明確に示すために故意に簡略化したものである。明らかなよう に、コードブックは、最も合理的な画像に対するたいていの形態のベクトル量子 化によって全空間コードブックサイズより十分低い値に減少させることができる が、画像のエントロピーと可視内容はそれでもなお、あらゆる単一の量子化器に 対しても圧縮対品質性能を左右し、したがって、上記で示した「最適な」量子化 器とプリミティブ量子化器との間の差は、「病的な」画像の場合は消滅してしま う。どんな量子化戦略に対してでも等しく適用される真の試験は、多くの視覚エ ラー感知性の低振幅で、平滑な勾配画素と広範囲に良好に分布したパターンとテ クスチャの範囲を持つ大容量のベクトル空間を用いる最悪の場合の画像である必 要がある。この制限性の場合においては、高視覚品質にとって必要なベクトル空 間は上記のプリミティブな例のサイズに近づき始める。 2つの異なる量子化戦略を用い、高振幅のデータを低振幅データから分離し、 空間的情報とピラミッド状構造体の冗長性を用いる組織を利用することによって 、本発明は、本発明が意識するあらゆる単一の量子化戦略によっても達成可能な 値未満のサイズ対品質比率を得ることができることが以下に示される。 したがって、有利な圧縮方法および圧縮システムは、比較的少ない高絶対値の 画素(プラトー112の範囲に収まるような画素)に対して用いられる量子化の クラスおよび比較的多い低絶対値の画素(スパイク104の範囲内に収まるよう な画素)を微分することによって得られるが、その理由は、各データセットは画 像ヒストグラムの実質的に異なる領域に存在するからであると、本発明者は判断 した。具体的には、スカラー量子化器はプラトー112中の画素に対して用いる ことができるのが好ましく、一方、ベクトル量子化器はスパイク104中の画素 に対して用いることができるのが好ましい。 これら2つの量子化器の動作は、エントロピーコーディングされた全体のデー タサイズが所定の画像品質に対して最小化されるかまたは、結果得られる圧縮さ れたデータ出力44が所定の全体サイズ未満となるように選択された分割点11 6によって分離され、このため、隣接するビット平面どうし間で分割が発生する (すなわち2の累乗)、すなわち1対の絶対的大きさとなる。2つの量子化器に 対して適切な分割点116を設定することによって、ベクトル量子化器によって 処理される値の範囲は、スカラー量子化器が処理しなければならない画素の数と 同じように減少する。 したがって、各量子化器の長所が有益に利用され、各量子化器の短所が消滅ま たは軽減される。具体的には、分割点116を割り当てる1つの方法は、プラト ー112に対するスカラー量子化器が無損失または見た目には無損失であり、ま た、スパイク104を処理するベクトル量子化器が、画像中で許されるあらゆる (目に見える)品質劣化の原因であると仮定することである。画像は、その品質 劣化が許容レベルであると、第1のスカラー量子化器によって最上の平面から第 3,第4,第5,…、というビット平面に量子化され、そのエントロピーコーデ ィングされたサイズは各ビット平面毎に決定されて記憶される。第2の(ベクト ル)量子化器は、指定された許容劣化判断基準によって残余のビット平面に対し て適用され、そのエントロピーコーディングされたサイズは各ビット平面毎に決 定される。次に、1対のビット位置に対して決定され記憶されたこの1対のサイ ズは比較され、最低の全体データサイズを与える分割点に対する量子化されたデ ータセットが記憶され、残余のデータセットは切り捨てられる。 画像形成のエントロピーは1画素当たり(色平面1つ当たり)のビット数とし て測定される。知らなければならないのは量子化器1つ当たりの全体のビット数 であるので、対象となる値は、(特定の量子化器の)エントロピーに、その量子 化器を用いて(各カラー平面上)で伝送された画素の数を乗算した値をすべての カラー平面に対して合計した値である。各量子化器は、所定の品質とビット平面 の割り当てに対して必要とされるビットの総数を有し、固定した品質を持つあら ゆる所定のビット平面分割の場合でも双方の量子化器に対する和の最小値が希望 されるデータサイズとビット平面割り当てのスキームとなる。 例えば、事前選択された目標品質に量子化すると、第1の(スカラー)量子化 器は、底部(を含め)から数えて第6のビット平面にまで4,000ビットのサ イズだけ下方に量子化し、底部(を含め)から第5のビット平面にまで8,00 0ビット下方に量子化し、第4のビット平面まで28,000ビット量子化し、 さらに、第3のビット平面まで80,000ビット量子化する。第2の(ベクト ル)量子化器は自体のコードブックのサイズを変更またはベクトル中における自 体の分布を変化させて、さまざまなビット深さ(および集団)に対する所定の品 質を維持する必要があり、したがって、底部(を含め)から数えて第5番目のビ ット平面から96,000ビットのサイズだけ下方に量子化し、底部(を含め) 第4のビット平面から80,000ビットだけ下方に量子化し、底部から第3の ビット平面から56,000ビットだけ下方に量子化し、底部の2つのビット平 面を36,000ビットだけ量子化する。このようにして、5/6ビット平面ス プリットに対するビットの和は100,000ビットであり、4/5ビット平面 スプリットに対しては88,000ビット、3/4ビット平面スプリットに対し ては84,000ビット、さらに、2/3ビット平面スプリットに対しては11 ,6000ビットとなる。量子化器のビット平面分割点はこのように第3と第4 のビット平面間で選択されて、所定の固定品質を持つ画像データに対して最良の 全体データサイズ(この例では圧縮比率は6.24:1)が得られる。 以下の説明では格子量子化器またはイクイッツ(Equitz)の PNN量 子化器の使用法を図示してスパイク104内の低振幅画像データを取り扱うが、 所定の振幅を持つ誤差に対する圧縮比率を十分制御できるかぎり、あらゆる適切 な量子化器を用いてもよいことが当業者には明白であろう。 すでに述べたように、本発明によるベクトル量子化器は特に制限されるもので はなく、本発明者は現在のところ、球形状またはピラミッド形状のコードブック を持つ格子量子化器とイクイッツの高速最近傍(PNN)量子化器のどちらかを 用いる方を選ぶが、こうすると、格子点に拘束されかねないことになる。イクイ ッツアルゴリズムは、エントロピーまたは品質レベルでの直接的な停止を可能と する比率歪み曲線の進行的なリアルタイムでの計算に良好に適していると信じら れている。リンデ(Y.Linde)、ブゾー(A.Buzo)、グレイ(R. Gray)による1980年1月のIEEE Transactions on CommunicationsのVol COM−28の84−94頁の「ベ クトル量子化器設計のためのアルゴリズム」(An Algorithm fo r Vector Quantizer)に述べるLBGアルゴリズム;ゲルシ ョ、グレイによる「ツリーとトレリスのコーディング」(Tree and T rellis Coding)(チャネル15)、「ベクトル量子化と信号圧縮 」(Vector Quantization and Signal Com pression)の555−586頁に述べるトレリスコーダ;1995年2 月ドーニー(R.Dony)、ヘイキン(S.Haykin)によるIEEEの 会報のVol.83の1−16頁の「画像圧縮に対する神経網的アプローチ」( Neural Network Approach to Image Com pression)に述べる適切な比率歪み制御装置を持つ神経量子化器;など の他の良好なベクトル量子化器および可とう性品質測定基準を用いてもよいこと が当業者には明らかであろう。 現在好まれている格子量子化器は、1982年3月のコンウエイ(J.H. Conway)、スロアンク(N.J.A.Sloac)によるIEEE Tr ansactions on Information TheoryのVol .IT−28の227−232頁の「格子量子化器とコードのための迅速な 量子化とデコーディングのアルゴリズム」(Fast Quantizing and Decoding Algorithm for Lattice Q uantizers and Codes)および、1983年11月のIEE E Transactions on Information Theory のVol.IT−29#6のコンウエイ、スロアクによる「格子量子化器とコー ドのための迅速な符号化方法」(A Fast Encodlng Metho d for Lattice Quantizers and Codes)に 教示されているものと類似しており、これら2つの出版物の内容は参照してここ に組み込まれる。 この格子量子化器は、ゲルショやグレイによるKluwer Academi c Publishersの474−476頁の「ベクトル量子化と信号圧縮」 (Vector Quantization and Signal Comp ression)に教示されている球形のコードブックとフィッシャ(T.R. Fischer)による1986年7月のIEEE Transaction on Information TheoryのVol.IT−32の「ベクト ルピラミッド量子化器」(A Pyramid Vector Quantiz er)に教示されているピラミッド型コードブックのどちらかおよび、1992 年のバーラード(M.Barlaud)、ソール(P.Sole)、アントニー ニ(M.Antonioni)、マシュー(P.Mathieu)によるICA SSP−92のVol.4の401−404頁の「画像コーディングに適用され るさざ波変換係数の格子ベクトル量子化のためのピラミッド型スキーム」(A Pyramidal Scheme for Lattice Vector Quantization of Wavelet Transform Co eeficient Applied to Image Coding)を用 いるが、これらの出版物の内容は参照してここに組み込まれる。 現在好まれているイクイッツのペアワイズ最近傍量子化器は、1989年10 月イクイッツ(William Equitz)によるIEEE Transa ctions on ASSPのVol.37の1568−1575頁の「新し いベクトル量子化クラスタリングアルゴリズム」(A New Vector Quantization Clustering Algorithm)に 述べられているが、その内容は参照してここに組み込まれる。 より低い値の画素のパーセンテージは比較的高いので(図5のスパイク104 に示す)、これらの画素は上記の格子またはPNN量子化器によって良好に量子 化される。さらに、プラトー112内の比較的大きい振幅を持つすべての画素ビ ットは以下に述べる離散した専用の量子化器に出力され、選択されたベクトル量 子化器によって処理される可能な離散ベクトルの数はまばらであり、したがって 、より小さいコードブックを伝送することが可能であるか、または事前定義され た最適に近いコードブックのセットが送信機と受信機のところで保持可能であり 、これによってコードブック全体を伝送する必要がなくなる。 当業者には周知のように、輝度チャネルベクトルをグループ分けする従来のア プローチは2x2の互いに隣接する2つの画素の方形ブロックをベクトルとして 用いることである。これは簡略であるという利点があり、平滑な画像にとっては 、ブロック中の近接した画素は通常はエッジから離れたところでは類似していて 、量子化器のエントロピーを減少させる。 このような2x2の方形グループ分けによって容認可能な結果がもたらされる とはいえ、本発明の好ましい実施の形態においては、ベクトルは、各方位ブロッ ク内の対応する位置に各方位から1つずつ与えられた同じピラミッド内の画素か ら成る三組となっている。この技法によってより自然に画像変換が再構成される が、その理由は、画像画素に対して寄与するには、ピラミッドにおけるあらゆる 縮尺に置いても変換画素をそれぞれ方位付けする必要があるからである。さらに 、各方位ブロック中の同じ相対的位置における同じピラミッドレベルの画素は、 元の画像中の同じスケールと空間的位置を表し、非常に類似し、したがって、三 組は主としてベクトル空間立方体の主対角線に沿って存在する。この技法はさら なる利点として、従来の2x2の方形ブロック技法と異なって、オブジェクトの エッジでさえも、所定のピラミッドレベルを持つ各方位における類似の振幅を持 つ傾向があり、これによって、エッジベクトルもまた対角線に沿って存在し、こ れによって、エントロピーをさらに減少させる。成分が(量子化の後では)同一 であるようなベクトルは、ベクトル集団の大きな部分が体積ではなく線として処 理 できるので、スカラーとして処理できる。 変換色平面は(ベクトル量子化器で処理すれば)、変換平面における所定の位 置において1対のCr画素とCb画素として処理できる。上述のように、均質な 色領域に対してはCrとCbはかなり一定であるため、Cr−Cb対の多くが同 じベクトルを共有し、このため、既存のCr−Cb対のコードブックは、個別に 処理された色平面のエントロピーの半分しか有しないことがあり得る。このよう なペアリングは、上述のスケール/方位三組のグループ分けに対して付加しても よく、これによってCr−Cb平面ベクトル量子化器のための6次元ベクトル空 間を生じる。 変換は、ヒストグラム100(確率密度関数)内のゼロに対してほぼ対称的な 画素値の集団を有するので、データは符号付きの大きさのフォーマットと分離し て扱われる符号に転換されたりすることが可能であると以下に述べるように仮定 すると、以下に示す技法で画素の絶対値を取り扱うことは統計的に理にかなった ことである。 ベクトル量子化器に関する上記の場合のように、本発明は特定のスカラー量子 化器と共に用いる使用法に制限されない。ある好ましい実施の形態においては、 変更済みゼロツリー量子化器は、その内容が参照してここに組み込まれるDCC ’93のData Compression Conferenceの214− 223頁の「さざ波係数のゼロツリーを用いる埋め込み型階層画像コーダ」(A n Embedded Hierarchical Image Coder Using Zero−trees of Wavelet Coeffici ents)中にシャピロによって述べられているものと概念が類似しているが、 プラトー112中の高値のエッジデータに対するスカラー量子化器として用いら れるシステムの基礎を成すものである。本発明者は、より高いビット値の数はそ の値が減少するに連れてほとんどのすべての画像中で減少し、また、これらのよ り高い値の画素は画像データの小さな部分(通常は2−10%)を占めるに過ぎ ないので、これらは、適切に実現されたゼロツリー量子化器によって比較的効率 的に量子化することができると判断した。 シャピロによって教示されたゼロツリー量子化器とは違って、本発明のある好 ましい実施の形態で用いられる変更済みゼロツリー量子化器は、シャピロが教示 する優勢リストと従属リストを一定に再配列したりシャフリングするとは限らな い。事実、リストはなんら必要なく、したがって、シャピロが教示する元来の技 法の複雑さのかなりの部分が、厳密な階層的伝送能力を必要としないことによっ て避けられる。たぶんさらに重要なことは、シャピロが教示するゼロツリー量子 化器が必要とするさまざまなステップサイズに再量子化することが避けられ、こ れによって、以下にさらに説明するように、再量子化に起因する画像データの「 押し傷」や「切り傷」が防止される。認識されるさらなる利点は、アルゴリズム が大幅に簡略化され、それと関連して処理速度が増し、計算上の要件が減少する ことである。さらに、しきい値やしきい値を2で除算する必要がなくなるが、そ の理由は、一時に1ビット平面毎に元来のデータが走査されることがないからで ある。その代わりに、DCブロック近傍の最高位ACブロックを通してラスタ走 査され、次にツリーを降下して、最大変換振幅と下の、ゼロツリーに割り当てら れる最下位振幅として指定される分割点との間で画素を読み取って格納されるが 、この分割点の更に下になると、ベクトル量子化器が用いられることになってい る。 こうする代わりに、本発明者によって開発された変更済みゼロツリー量子化器 によって、以下に説明するアルゴリズムを用いて、画像中のオブジェクトのエッ ジのところに、具体的に言うとサブゼロツリーコーダ()(Sub Zero Treecoder())のところに、添付付録Bに示す疑似サブルーチンのフ ラグメントを参照して、データツリーが位置付けられる。 付録Bの疑似コードの例では:「カラー」はさざ波ピラミッド変換のY、Cr およびCbの色平面のことであり;「振幅」は別様に記述がない限り絶対値のこ とであり;「レベル」は、最下位レベルがさざ波ピラミッド変換の最大ブロック 内に存在する最も微細な詳細を表すさざ波ピラミッド内の単一のスケールのすべ ての方位を意味し;「ブロック」が、さざ波ピラミッド変換の1つのスケールの 1つの方位を意味し;水平方向のブロックである「水平ブロック」がスケールの 右上の象限のことであり;縦方向のブロックである「VerBlock」がスケ ールの左下の象限であり、対角線上のブロックである「DiagBlock」が スケールの右下象限のことであり;「画素」(“pixel”)という用語が「 画素」(“pel”)は交換可能に用いられて、単一カラー平面の変換空間の単 一アドレス中に格納されている値を意味する。また、疑似コード中の二重引用マ ーク内のラベルはサブルーチンである。 使用においては、変更済みゼロツリーコーダによって各色平面が順に走査され 、優性パス中の新たに有意となった画素が探索され、従属パスでは、振幅情報が 、優性パス中で有意であることが分かった画素に対して付加される。本書で用い られるように、「新たに有意である画素」という用語は、ベクトル量子化器では なくゼロツリー中の自体の内部に絶対値の場所を持つ画素を意味する。 コーダに対する基本的な変更は別々の量子化器に割り当てされたスプリットデ ータセットである。まばらで大振幅で低集団のデータはベクトル量子化器では良 好に圧縮しないが、この理由は、ポインターツーコードブック構造は、少ない数 のプロトタイプ的コードブックベクトルが大集団のベクトルを正確に表すことが 可能である場合に効率的になるだけであるからである。したがって、このタイプ のデータはスカラー量子化したほうがよく、不必要な低振幅データを配置する適 切な方法は、非ゼロ情報を伝送するだけのゼロツリーを用いることである。これ は効果的なスカラー量子化である考えられる。同様に、ゼロツリー量子化器の出 力は、低振幅データの多くに対する最低位レベルのツリー構造を充填するために 必要とされる場合には急速に膨張するが、その理由は、そのほとんどがターミナ ルツリーの分岐であり、このレベルを持つ可視情報は、より高いレベルほどには 画像再構成にとってほとんど重要ではなく、コーダ時間の無駄使いになるからで ある。その一方では、さざ波変換のヒストグラムは、典型的な画像にとって、ベ クトル量子化には合理的なように、絶対値の低いデータは非常に大きな集団を有 することを明瞭に示している。したがって、量子化器を最適に割り当てるには、 ピクチャ中の低集団−高振幅エッジ情報に対してゼロツリーを適用することにな り(しきい値116から正と負の値になる図5の曲線112を参照)、低振幅の テクスチャとノイズの山をベクトル量子化器に対して残すことになる。 現在好まれている判断基準は、しきい値を、曲線104が曲線112と交差す るゼロのいずれかの側で対称的に置くことである。極端な圧縮の場合、ベクトル 量子化器は開始すらされないが、ビットレートは、ゼロツリーコードがそのドメ インをコーディングした後でもまだ利用可能であり、もしユーザがより高い品質 判断基準をサイズの代わりに指定すると、格子または最も近傍の量子化器がその ドメイン中のすべての画素をコーディングし、そのベロノイ(Voronoi) 領域を減少させて、所定の品質に対して最良のサイズに到達する。そのうえ、本 書以外で説明するように、ベクトル空間はあらゆるベクトルに対してポインタを 送出する必要はなく、最高エネルギを持つベクトルに対して送出する必要がある だけであり、ベクトルポインタは、構造体に対して少数の記号を付加するだけで 、アドレスする必要はなくゼロツリー中に埋め込むことができる。 色平面毎に、変更済みゼロツリーコーダは、対応するさざ波変換結果をロード して、画素の符号とは無関係に、最高位の被占有ビット平面を決定する(非DC ブロックの画素だけを探索する)。変更済みゼロツリーコーダによって検査され ることになっているコード(すなわち、分割点)に対する最低位ビット平面また は最小の振幅は、上述の外部アルゴリズムによって決定される。 「一時に単一のビット平面を走査する」プロセスにおいて、それに割り当てら れた各ビット平面に対して、コーダは各ACレベルのさざ波ピラミッドを、DC ブロックに最も近いレベルから最大で最低のレベル(レベル0)に至る順序で、 以下に示すような方式で走査する。 DC項目に最も近いレベルから始めて、変更済みゼロツリーコーダは、レベル 内のすべての3方位ブロックを平行に走査して、新たに有意となった画素を探索 する。ラスタ走査は、最上位から下方に1行ずつ左から右に走査し、1つのレベ ルのすべてのが画素が、次のレベルの方位がラスタ走査される以前に検査される 。これは、所定のレベルにおいて、コーダは各方位に対応する画素(現行のレベ ルにおける各ブロック内の同一相対的位置における1つの水平方向画素、1つの 垂直方向画素および1つの対角線方向画素)を検査して、その位置におけるなん らかの方位が現行のビット平面に存在するか否か、また、有意であるとタグ付け されていないか判断する。 最低位レベル以外のあらゆるレベルにおける画素も、画像空間内で同じ位置と 方位を表す次に低いレベルでの2x2の画素四つ組の親であると見なされ、これ 以外の画素はその子であると見なされる。この空間的関係は図6に概略的に示す が、ここでは、ブロックHL2中の画素200はブロックHL1内の2x2画素 四つ組204の親であり、四つ組204内の画素(204a、204b、204 c、204d)のそれぞれは、ブロックHL0内のそれぞれ2x2四つ組208 a、208b、208cまたは208dの親である。四つ組204および四つ組 208a、208b、208cおよび208d内の画素のような、子の複数の「 世代」を持つ200などのあらゆる親画素も、これら画素すべての先祖と呼ばれ る。ある方位中で新たに有意であると分かった「最年長の」(最高位の)親はデ ータツリー根と呼ばれる。 これら3つの画素の内の1つまたは複数が新たに有意となると、そのアドレス は有意であるとタグ付けされ、現行のレベルでの水平方向ブロック画素の対応す るアドレスは、アドレスデータストリーム中で以前に有意であったデータツリー 根アドレスに基づいてデルタコーディングされ、このアドレス値はそれ自体がア ドレスデータストリーム中に置かれる。 3つの方位のデータツリーが、本書ではモルトン(Morton)走査プロセ スと呼ばれる、図7に示す走査プロセスを用いて、現在ラスタ走査中の現行レベ ルの3つの先祖画素のそれぞれから0を含めたレベルにまで下方に、現行のビッ ト平面での新たに有意となった画素を求めて走査される。エッジデータは一般に 、2画素(負の側と正の側)という最小の幅を持って、さまざまな方位の線上で 発生するので、2x2の走査パターンを用いると、単一ラスタ走査より多くのエ ッジ項目が収集され、これによって画像のエントロピーを減少させる助けとなる 。新たに有意となった画素が見つかったら、そのアドレスが有意であるとタグ付 けされ、それには符号を示すラベルが付けられる。ある画素が有意でないまたは 以前には有意であった場合、それはゼロと割り当てられて埋め込まれる。 現行の三組の先祖画素のツリーがすべて走査されると、これらはゼロツリー根 が有るか否か検査される。ゼロツリー根は、自体がゼロであって以前のゼロツリ ー根の子孫ではなくその子孫がすべてゼロである画素として定義されている。ゼ ロツリー根がデータツリー中で発見されると、それはゼロツリー根であるとラベ ルを付けられ、その子孫はすべてそのツリーから除去される(すなわち切りつめ られる)。これが実行されると、正の値、負の値、埋め込まれたゼロ値およびゼ ロツリー根の記号から成るデータツリーは、モルトン走査の順序で一時に1つの 方位に対して優性なデータストリーム中に置かれる。 次に、変更済みゼロツリーコーダは次のステップに進行して、現行の階層中の 次の画素三組を捜査し、レベルが尽きるまで現行レベルの三組をすべてラスタ走 査する。次に、コーダは次のステップに進行して、すべての画素が現行のビット 平面で有意であるか走査されるまで、次の下位のレベルで同じように三組をラス タ走査する。ひとたび1つのビット平面に対して優性パスが完了すると、2つの 代替方法の内の一方が用いられて、前の優性パスで見つかった有意の画素の絶対 値を伝送または格納する。 絶対値を伝送したり格納したりするための第1のそしてより綿密な代替方法で は、以前の優性パスすべてにおいて見つかった順序において、なんらかのビット 平面で有意であると以前にわかった各画素に対する次の下位の平面のビット値が 伝送される(または格納される)。この方法は、付録Bでは「詳細な方法」と呼 ばれるが、一時に1つのビット平面毎にすべての有意な画素を精製する、すなわ ち「進行性伝送」するが、データ伝送ストリームが永久的に停止すると(または 記憶されていた情報が失われると)、結果としての再構成された画像が、画像全 体にわたって、エッジも含めて、等しく悪質であって、微細な詳細はほとんどな く、エッジ近傍で切り傷や押し傷として現れる質の悪い陰影の平滑度を有するこ とに悩まされる。 第2の代替方法は現在好まれている方法であり、付録Bでは「簡略化された方 法」として知られている。この方法は幾分簡単であり、以前の優性パスにおいて 新たに有意であると分かった各画素に対して、従属データストリーム中で、優性 パス中で伝送される符号以外のすべてのビットが、次の下位のビット平面からゼ ロツリーコーダに割り当てられた底部ビットに至るまで伝送される(または格納 される)。この伝送された(格納された)値は、ベクトル量子化器がゼロツリー のデータ未満のビットを処理するのであれば、すなわちそれを適当に丸めてエン トロピーを減少させることができるのであれば切り捨てることができる。認識さ れた利点の1つが、数ビット平面後で(すなわち格納されたファイルが切り捨て られたり損傷を受けたりした後で)データ伝送が遮断されると、結果生じる画像 はパターンやテクスチャの詳細が(データストリームのどこで割り込みが発生し たかによって)欠けているが、3次元形状を与えるエッジとその隣の画素は良好 に定義可能であり合理的に輪郭付けできるが、その理由は、非ゼロ変換画素に対 して十分なデータを伝送(格納)できるからである。さらなる認識された利点は 、この代替方法は類似の振幅従属パスデータをベクトルにグループ分けすること ができるが、これはシャピロの実行方法では不可能なことである。 このプロセスは、ゼロツリーコーダに別のビット平面が割り当てられていれば 、従属パスの後で下方に1ビットだけジャンプする。色変換平面はそのすべてが 同様にゼロツリーコーディングされているが、サブサンプリングされた色平面の 場合には、コーディングによってエントロピーが減少し始める前に最低位のレベ ル(レベル0)を除去することが可能であり、また、色平面を、もし視覚ルール を満足するために必要であれば別の最低位のビット平面にコーディングすること が可能であるという点が異なる。 従属パスは、以前のすべての有意データに対して次のビット平面を下方に伝送 する(格納する)かまたは以前のビット平面上で有意であると分かったすべての データに対してゼロツリーコーダに割り当てられたすべてのビットを伝送(また は格納)することによって実行することができる。 ゼロツリーコーダを割り当てて、それがどれほど多くのビット平面を走査する かとは無関係に、新たに有意なデータを探索しながら、有意のデータに対して任 意の数のビットを維持することができることに注意されたい。これは、ベクトル 量子化器中のゼロをゼロツリーコーダによってコーディングされたいずれかの画 素に割り当てることによって、以下に説明するベクトル量子化器の外部に無相関 データを保持する際に有用である。用いられるピラミッド構造においては、各レ ベルは通常は、マー(Marr)によって、首尾一貫した再構成済み画像品質を 得るためのそれ未満のより大きなレベル(より微細な詳細を含む)であると推論 される人間の視覚感覚ルールによる精度の2倍の精度を必要とし、したがって、 この有利な方法によって、コーダ中の1つ低いビット平面または値をピラミッド のそれぞれのより低いレベルに維持するが、これを本発明者は「段丘付け」と呼 ぶ。 「単一パスゼロツリー」は、付録B中の「簡略化された方法」を用いる場合に 有用な「一時に単一のビット平面を走査する」プロセスに対する代替方法であり 、この方法では、ゼロツリーとベクトル量子化器にビット平面を割り当てるため の最適な分割点を決定して、次に、変更済みゼロツリーコーダを用いて、ゼロツ リーに分配されたビット平面上に存在するに十分大きなすべての画素を求めて大 きさの大きいものから小さいものに至る順序で走査し、データ根アドレスと記号 を上記のような優性パスデータ中に位置付けし、画素の絶対的大きさを上記のビ ット深さにまで従属パスデータ中に位置付けする。この方式によってアドレスデ ータが大幅に減少し、ゼロツリー中の埋め込み済みゼロ要素の数が減少するが、 この理由は、1ビット平面当たり1つのパスの代わりにたった1つのゼロツリー パスしか存在しないからである。 上述のように、単一のパスゼロツリーが用いられると、最高位レベルにあるA Cブロックを、格納オーバヘッドがほとんど無しでラスタ走査可能であるが、こ の理由は、これらのブロックは、なんとかしてほとんど完全に送出する必要があ るからである。ひとたび最上位のACレベルが走査されると、埋め込まれた記号 のセットは、あらゆるアドレスストリームも必要とすることなく画像ツリーを再 構成する。次に、適切な記号を付加することによって、レベルn+1にある画素 はベクトル量子化器デコーダに対して、ゼロツリー中のレベルnにあるあらゆる 可能な四つ組の子画素と共に、ベクトルストリームデータ中の次のベクトルがレ ベルnの子四つ組と関連する低振幅データに属すことを示す。 ゼロツリー原理の延長であるゼロベクトルコーダは次に示す記号のセットを用 いる(当業者には明らかなように、実際の文字は、3ビット記号がそうであるよ うに特定の有意さを持たない)。 + sgnif.+ve, データツリー子が存在する、 子ベクトル無し − sgnif.−ve, データツリー子が存在する、 子ベクトル無し v sgnif.+ve, データツリー子が存在する、 子ベクトル有り 0 embed.zero, データツリー子が存在する、 子ベクトル無し x embed.zero, データツリー子が存在する、 子ベクトル有り R zerotree root,データツリー子は存在しない、子ベクトル無 し * データ誤差による伝送の再同期付けのための任意のエンドオブブランチ記号 上述の2つの圧縮空間戦略の各動作をここで説明する。ここに説明するこれら の戦略の動作は現在好まれているものであるが、他の適切な実現方法を希望次第 で用いることが可能であることが理解されよう。 「最小品質限界」戦略の場合は、ピーク信号対ノイズ比(PSNR)や平均自 乗誤差(MSE)やL1歪みなどの事前選択された適切な測定の基準を用いて適 切な品質限界が各色サブバンドに対して指定される。次に、画像の各色サブバン ドのヒストグラムが検査されて、選択された品質レベルを得るために必要とされ る確率密度関数(ヒストグラム)ビット分割値を決定する。量子化段階36(こ れには、ゼロツリーコーダで用いられるなんらかの丸め操作および格子方法また はイクイッツ方法によって実行されるなんらかの量子化が含まれる)および無損 失コーディング段階40では、最高位ビット平面データがゼロツリーコーディン グされ、次に無損失で(エントロピー)コーディングされる。 次に、プロセスは、画像データの2番目の高いビット平面を処理するために同 様に進行し、次に、第3のビット平面に対してという具合に進行して、ついには 指定された品質判断基準(MSE、PSNTなど)が満たされる。 無損失コーディングされたゼロツリーデータのコードサイズが、最高集団のビ ット平面から下方に各連続したビット平面まで別々に記録される。(プロセス中 のこの点においては、ゼロツリーコーディングされたデータおよびそれより下に あるビット平面が、次のステップで、ゼロツリーより下にあるなんらかのビット 平面がベクトル量子化される以前に完全な再構成を構築する。) 次に、コーディングした結果、指定された品質限界が満足されたゼロツリーの 最後のビットレベルがベクトル量子化器に(符号の+/−も含めて)転送され、 格子量子化器を使用する場合は(3次元か4次元)格子によって、または(3次 元または4次元の)ベクトル空間上でイクイッツPNNアルゴリズムを提供する ことによって、このビット平面およびそれより下にあり0に至るあらゆるビット 平面はベクトル量子化される。どちらの場合でも、品質とエントロピーは、下位 のビット平面上でベクトル量子化プロセスによって同時に減少し、品質とエント ロピーは双方共、ベクトル量子化が進行するに連れて測定され、この量子化プロ セスは、品質限界がもはや満たされなくなったら停止する。 格子量子化器の場合、エントロピーの減少が、よりまばらに置かれた格子をベ クトルデータ上にマッピングすることによって遂行されることは明らかである。 PNN方法の場合、エントロピーは、併合されるクラスタ対を賢明に選択するた めの視覚判断基準に従って、対の隣接するクラスタを併合することによって減少 される。品質判断基準が「オーバシュートされる」と、プロセスは、格子の場合 における以前の格子間隔とコードブックを用いて、または、イクイッツの場合に おける最後のPNNクラスタ対の併合を解くことによって以前のエントロピーレ ベルにまで逆行する。次に、格子またはPNNデータが、適切であれば無損失に コーディングされ、その結果としてのデータのサイズ(伝送する必要がある場合 は無損失コーディングされたコードブックサイズも一緒に)は、無損失コーディ ングされたゼロツリーのサイズに付加され、このベクトル量子化器の上にビット 平面上でコーディングされて、複合量子化されたデータのサイズを得る。 結果としての全体サイズが符号化されたゼロツリーに、この以前のゼロツリー (第1のベクトル量子化器パス上には存在しなかった)より下で発生したなんら かの符号化されたベクトル空間を加算したものの以前のビット深さより小さい場 合、プロセスは、ベクトル量子化器によって処理のためにコーディングされたゼ ロツリーからもう1つのビットレベルを取って繰り返される。この理由は、典型 的な変換の統計によって、エントロピーがビット平面をゼロツリーからベクトル 量子化器に移動させることによって減少すると、このエントロピー対量子化器分 割曲線が降下するが、それでもなお、より下位の分割されたエントロピーがまで 試験されないまま残っていることがあるという事実に起因する。第1パスの場合 、エントロピーコーディングされたベクトル量子化器のサイズ寄与はゼロであり 、そのため、エントロピーコーディングされたゼロツリーから底部ビット平面を 減算してその下にあるエントロピーコーディングされたベクトル量子化器(とコ ードブック)を加算したものを、品質判断基準を満たすために必要な最後のビッ ト平面に対してコーディングされたエントロピーコーディングされたゼロツリー のサイズとだけ比較する。 このプロセスは、結果としての複合無損失コーディング済みデータサイズが以 前の結果としてのデータサイズより大きくなるまで繰り返されるが、このように 大きくなった時点で、以前の結果は、所与の品質がパスしたときにエントロピー 対ビット平面割当て曲線中で最小値として採用される。ゼロツリーに割り当てら れたビット平面は、下位ビット平面をベクトル量子化器で符号化する前に「単一 パスゼロツリー」を用いてコーディングすることができる。三組の代わりに子四 つ組をこのプロセスで、特に単一パスゼロツリーコーダ中で用いると、量子化と 無損失コーディングは一時に1ブロック毎に実行される。 最大サイズ限界が選択されると、量子化段階36および無損失(エントロピー )コーディング段階40は次のステップに進行して、上記の変更済みゼロツリー コーダを用いて最高集団化平面から下方に上記の最小品質プロセスの場合と同様 にビット平面をコーディングし、ついには、サイズの判断基準が満たされるか、 または画像がビットから外部にでてしまうかの、どちらか早期に発生する。もち ろん、画像はたとえ発生したとしても、第1に最大サイズ限界が不合理なほどに 大きい場合でない限り、ビットの外に出てしまうことはまれである。 次に、(「一時に単一のビット平面を走査する」プロセスまたは「単一パスゼ ロツリー」を用いて)、連続するビット平面深さのそれぞれに対して、独立に、 結果得られたゼロツリーに無損失コーディングが実行され、その結果としてのコ ードサイズが記録される。次に、ベクトル量子化器を用いて、ゼロツリーの底部 ビットから下方に0に至るまでビットを、格子コードを用いるかイクイッツPN Nアルゴリズムを適用するかして、画素のセット(上記のようにグループ分けさ れている)上で量子化する。このプロセスの間、エントロピーと品質は、エント ロピーに基づいたベクトル量子化済みデータのサイズとなんらかのコードブック に対して、ベクトル量子化器データの上のビットに到達するエントロピーコーデ ィングされたゼロツリーデータのサイズを加算した値が最大サイズ判断基準を満 たすまで記録される。 圧縮速度が品質以上に必要とされる環境下では、アルゴリズムはこの組み合わ せを停止することができる。最良の品質が希望のサイズで必要とされる環境下で は、ベクトル量子化器が再度呼び出されて、ゼロツリーコードから1ビット平面 だけ除去されて膨張する。適切なエントロピー減少方法が適用されて、エントロ ピーと品質を追跡し、ついには、ベクトル量子化器のエントロピーに基づいたサ イズおよびなんらかのコードブックに、新しいベクトル量子化器の上のビットに 到達するエントロピーコーディングされたゼロツリーのサイズを加算したものが 最大サイズ判断基準を満たすに至る。次に、この量子化器の対の品質は以前の量 子化器対と比較される。 この品質が指定のデータサイズにまで向上すると、ベクトル量子化器は再度ゼ ロツリーから取られた1ビット平面だけ膨張し、このプロセスが繰り返される。 品質が向上しない場合、以前のゼロツリー/ベクトル量子化器の対が用いられる が、その理由は、プロセスが、所定のコードサイズに対して品質対ビット平面割 当て曲線の最大値を通過してしまっているからである。 本発明者は、本発明の付加的な利点の1つは、各画像データの適当なドメイン 中にあるゼロツリーコーダとベクトル量子化器を用いることによって、ゼロツリ ーによる新しいステップサイズへの画像の再量子化が避けられることであると考 察する。画像がディジタル化されるということはすでに量子化されたということ であることは明らかである。画像データを再量子化するということは計算を集約 化し、そのことによって、必然的に量子化ノイズを伴う。データが平滑に変化す る位置では、ある対の隣接する近接値を持つ画素を丸める方向が変化して(再量 子化に特有のリスクである)、視覚再量子化ノイズが場所によっては最大となり 、この結果、画像中に「切り傷」や「押し傷」がもたらされることになる。本発 明者が意識しているあらゆる従来技術による量子化スキームにおいても、量子化 ステップサイズの変化を伴う再量子化が必要とされる。したがって、これらの技 法は、このような誘引されたアーチファクトを受信機において減少させるために は、高圧縮レベルでの画像損傷(アーチファクト)を引き起こし、および/また は、さらなる高価な計算を伴う処理を必要とする。 垂直方向か水平方向(または対角線方向)に変換内で隣接するこれらの画素は 、互いに反対方向に量子化(丸め操作)され、適切な2次元分析関数を用いて平 滑領域の一部として識別されているので、平滑度タグを伝送されたベクトル量子 化器データセット内に有することができる。受信機において、これらの量子化に よって損傷を受けた平滑なベクトルは適切なフィルタによって局所的な2次元勾 配に再平滑化することができると考察される。このフィルタは、過度の量子化ノ イズに悩んでいる2つ以上の画素を再平滑化するための2次元周囲を使用するこ とが可能であればどのようなフィルタであってもよい。平滑化される2つ(また はそれ以上)の画素上に中心を持つ4x4または5x5の画素ブロックが適切な 平滑化のための周囲となり得る。 小さなグループ中の複数の画素の両方向の丸めの場合は、より大きな5x5の サンプル領域を用いることができ、また、タグ付けされたすべての画素は、受信 機におけるフィルタに供給される平滑化サンプルから除去することができる。こ の技法によって、エッジ、パターンおよびテクスチャを無差別に平滑化するとい う受信機に基づいた平滑化アルゴリズムの問題点がアドレスされる。また、この 技法によって受信機での処理負担が大幅に軽減されるが、その理由は、量子化器 によって反対方向に丸められるこのような平滑な画素の対はあまり多くないから である。このプロセスは伝送済みの平滑度データという点ではオーバヘッドをほ とんど必要としないが、その理由は、合理的に量子化された画像の場合、平滑度 領域中にはこのような切り傷はほとんど存在せず、また、再構成された画像に対 する改良が目に見えて顕著であるからである。 ゼロツリーコーダは、輝度のコントラストによってノイズやマスキングしやす いようなエッジを主としてコーディングし、また、そのデータは低位のビット平 面より高位の相対的精度に送出されるので、この量子化器においては平滑度の問 題は無視してよい。しかしながら、ゼロツリーコーダは小さなデータセットを表 し、それはベクトルの小さなコードブックに後続されることはないので、平滑度 データ画素に対する量子化切り傷は、量子化器によって用いられたビット平面分 割点とは無関係に、識別済みの平滑画素を十分な数のビットに対して伝送するこ とによって直接にアドレスされることができる。 無損失コーディング段階40は、なんらかの適切なコーディング技法であり得 ることが当業者には分かるだろう。例えば、ハフマン技法、演算技法、あるいは レンペル技法、Ziv(LZ、LZ77,LZWなど)技法によるコーディング が採用される。さらにエントロピーを減少させるには、神経ベクトル予知コーダ 技法をベクトルに対して用いることができるが、この技法は、1994年4月、 R.フィオラバンチ(R.Fioravanti)、S.フィオラバンチ(S. Fioravanti)、ギスト(D.Giusto)らによるICAASP− 94のVol.5,IのV613−V616頁の「ベクトル量子化のための効果 的な神経予知」(An Efficient Neural Predicti on for Vector Quantization)中に説明されている 。 どの無損失コーディング技法を選択するかは、ある程度は、圧縮技法の圧縮比 率の高さおよび計算上の複雑さ(すなわち、所与のプロセッサ上でデータがコー ディングされる速度)との兼ね合いであろう。ビデオ画像システムの場合、LZ WやLZ77などの速度は速いが一般に効率が劣るコーディング技法、さらに1 996年のヘルド(Gilbert Held)による「データと画像の圧縮用 ツールおよび技法、第4版」(Data and Image Compres sion Tools and Techniques,Fourth Edi tion)の第4章の265−310頁に述べられているような技法が好まれる が、一方、静止画像の場合は算術コーディングが好まれる。しかしながら、当業 者には明らかなように、本発明は専用のハードウエア中で実現される場合、無損 失コーディングスキームの速度などの関心事は和らげられる。 画像の品質が低度から中度だけであるビデオ圧縮の場合、追加的な性能が、量 子化に先だって色空間をサブサンプリングすることによって得られる。具体的に は、色サブバンドの底部レベル(最高解像度さざ波階層)を処分することができ ることが分かっている。受信機(デコンプレッサ)は単に、行方不明の底部レベ ルに対するたたみ込みピラミッドの水平方向、垂直方向および対角線方向のブロ ックの平均値を取るだけであり、これはビデオ記録用途では4:1:1のサブサ ンプリングに等しく、この場合、色情報の解像度は単色情報の各方向で半分であ る。 しかしながら、ゼロツリーコーダは最低位の階層に到達し、これによってより 大きな振幅の色データに対して良好な高解像度の色を位置合せし、同時に、サブ サンプリングされた色のエントロピーが低いという点を享受できる。通常は、色 変換平面を、所定の視覚品質レベルに対する輝度平面よりさらに圧縮することが できる。これは、色平面は最低位のブロックではなんらのベクトル量子化器も( すなわちまったく)必要とせず、純粋にゼロツリーコーダによって取り扱うこと ができることを意味する。 4:1:1というサブサンプリングを用い、また、ゼロツリーが色変換結果中 の底部レベルに達しない場合、本発明者は、視覚品質は、変換結果中の輝度エッ ジで再位置合せするために色画素の領域を「流出する」ことによって、回復する ことができる。 完全運動ビデオの場合、運動予知技法や、キーフレーム同士間でいくつかのデ ルタフレームを用いてフレーム毎に変化するようなブロックだけをコーディング する技法などのフレーム間圧縮技法を用いて、帯域幅をさらに縮小させることも できることが当業者には明らかであろう。 画像を再構築するには、運動画像圧縮スキームと静止画像圧縮スキームの双方 に対する実際の個別フレーム再構築は以下のように実行される。 各色平面に対して、DCブロックは、必要に応じて逆エントロピーコーディン グされ、また、逆デルタコーディングされて、ゼロツリーデータは適当なデコー ダによって逆エントロピーコーディングされて、さまざまなコーディング済みデ ータ根アドレスストリーム、優性パスのデータツリー記号ストリームおよび従属 パスの振幅データストリームを生じる。この後で、DC項目に最も近い階層から 始めて最高位階層から最低位階層の順で、ゼロツリー中に記録済みの画素の、符 号ビットおよび、変換空間座標上の位置が抽出され、更にこの後で、ゼロツリー コーダに対して指定された精度に対するその絶対値が抽出され、これらの値は符 号ビット付きで結合されて、符号付きの大きさとなる。 データツリーとアドレスが再構成されると、デルタアドレスとしてまたはすべ てゼロツリーデータストリーム中に含まれる暗に示す各アドレスに対応するデー タは変換用に割り当てられたメモリ空間中に走査される。第1に、データ根の符 号付き大きさはその位置に格納され、次に、記号データを用いてゼロツリー、符 号および埋め込み済みゼロ値を充填し、モルトン走査パターンを用いて、高位か ら低位の階層の順にツリー中の無意味な画素を充填する。有意データ位置に対す る従属データはモルトン走査パターン中でツリーを下方に沿ってロードされて、 もし格納するべきである場合はビット平面毎に、または、前もって符号付きで結 合されるべき完全な絶対値として、ゼロツリーと埋め込み済みゼロ値を避けるよ うにする。 ベクトルデータは逆エントロピーコーディングされ(ベクトルデータを無損失 圧縮するためにどちらのエントロピーコーダが用いられようとその逆をする)、 コードブックに対するポインタのセットであるベクトルデータが次に読み取られ て、変換結果の底部ビットが、各ポインタに対するコードブックのエントリを取 り出すことによって画素のグループ中に集団化される。これが完了すると、変化 結果は、さざ波変換操作の逆を実行中に切り傷や押し傷を平滑化するためになん らかの濾過操作を受ける準備がある。 1対のまたはそれを上回る数の画素が平滑化フラグでタグ付けされると、平滑 化は、変換物に対して直接的に平滑化フィルタを用いて変換空間中で実行するか 、またはレベルが1レベルだけ逆さざ波処理されて画像空間中で対応する(ここ では2倍に縮尺されている)位置で平滑化が適用されるようにするかのどちらか が可能となる。画像が非単色(カラー)である場合、次のステップでは、Y−C r−CbからRGBへの色変換が実行されて、適用された圧縮の度合いを与えら れた元来の画像の合理的な再構成物である圧縮データ出力44が生じる。 上記では説明されていないものに、圧縮済みデータ出力44をノイズチャネル 上で伝送するために必要となり得る誤差検出がある。このような誤差検出と調節 を実現するなんらかの適切な技法および/または方法を本発明と共に用い得るこ とは当業者には明らかであり、更に本書で説明する必要はないだろう。 上述のように、無損失圧縮が望ましくしたがってさらなる圧縮が量子化技法か ら得ることができないような環境下では、本発明は次のように動作する。信号処 理段階32においては、第2のさざ波処理パスが、ピラミッド中で最大の1レベ ルまたは2つのACレベルの各3つの方位において各方向で実行されて、テクス チャを変換のより小さなサブブロック中に濾過することによってほとんどの画像 に対するエントロピーを大幅に減少させて、多くのゼロ値画素を平坦領域中に残 す。これによって、低/低周波数情報をサブバンドの左上の象限中に収集し、高 /高周波数情報をサブバンドの右下象限中に収集することになる。 追加の圧縮が量子化技法では得られない無損失圧縮応用例においてはこれは非 常に有用であると考えられる。追加のさざ波パスの処理時間における経費は、医 療分野の撮像などの重要な用途で得られる追加格納や帯域幅に比較すれば大した ものではない。第2のさざ波パスでは、図8と9に示すようなゼロツリー方法の 空間上の位置関係を変更する必要がある。1つの方位に対して1つのパスがある 最下位の2つの階層上の二重パスさざ波の空間的関係を示すこれらの図では、画 素を表すボックス内の数字はツリー構造順序付け情報を示す。 データツリーは、図6と7を参照して上述されたピラミッドの場合と同様に形 成されるが、親画素は次の階層中では子の前に来て、サブバンド中の子画素は左 から右、上から下の順序であらゆる方位に対して走査され、子の四つ組または超 四つ組がモルトンパターン中で走査される。 サブバンドはすでに双方向で掃引されているため、3つの新しいACサブバン ド中のデータは空間的に非常にまばらであり、したがって、画像はさらに相関が 解除される。さざ波のさらなるパスがあると、再構成を完全なものとするために より有意なビットを保持する必要があることに注意することが重要である。具体 的には、当業者には明らかなように、重大な誤差があると、サブバンドによる厳 密な誤差限界が守られないような画像となりかねない。明らかなように、追加の さざ波パスに対する処理時間における経費は、医療分野での撮像などの多くの用 途で得られる追加格納や帯域幅と比較すれば大したものではない。 2x2画素ベクトル量子化器を用いて、低位ゼロツリーしきい値未満の低振幅 データを符号化すると、必要なデータだけを伝送したり保持したりする最も効果 的な方法は、ささいでないようなベクトルだけを(すなわち非ゼロベクトルだけ を)送出することであり、これには、アドレス指定付きベクトル量子化器が必要 である。記号のセットを大きくすることによって仮想的にゼロツリーコーダ内に アドレスを格納するメカニズムはすでに存在するので、ツリーのノードに属する 2x2ベクトルをコーディングするための小さな記号をベクトルデータストリー ム(多分、ベクトル内に通常のゼロツリーの子を埋め込んだようなもの)の中に 埋め込むことが可能である。ベクトル量子化器が格子である場合、コードブック の無い、そして極端に迅速なものとなり得る。ベクトル量子化器によるプロセス が最も近いアルゴリズムであれば、通常の格子より良い併合ノードとなるが、速 度は遅く、コードブックを格納して伝送する必要がある。 本発明者は、第1に最も近いものを用いて合理的にクラスタのカウントを最小 の誤差で減少させ(これは格子ベクトル量子化器では困難)、次に、なんらデー タを併合することなく適当な格子に残余のクラスタを位置合せするようなハイブ リッドのベクトル量子化器(ハードウエアが利用可能または速度が増加する場合 )を提唱する。こうすることによって、コードブックの無いベクトル量子化器が 、格子ベクトル量子化に特有の欠点無しで動作可能となる。 本発明の上述の実施の形態は、その例示目的のものであり、添付請求の範囲だ けによって定義される本発明の範囲から逸脱することなく、当業者による変更や 変化が可能である。 付録A 画像へのドーバチーズ−4さざ波操作のマトリックス表記 付録B 変更されたゼローツリーコーダ 詳細な方法 簡略化された方法 データッリープロセッサ
【手続補正書】特許法第184条の8第1項 【提出日】平成11年1月8日(1999.1.8) 【補正内容】 請求の範囲 1. ディジタル画像を圧縮して、後続の再構成のための圧縮済み画像データ を得る方法であって、前記方法が: (i)前記ディジタル画像がRGB色空間中でカラー画像であるか否かを判断 し、判断済みRGBカラー画像を冗長度の少ない色空間に変換するステップと; (ii)前記冗長度の少ない色空間中のさざ波分解を前記画像の色空間のそれ ぞれに対して実行して、DC項目および非DC項目の変換結果を得るステップと : (iii)前記DC項目を無損失にコーディングするステップと; (iv)前記変換結果を符号と大きさから成るフォーマットに変換して、隣接 する1対のビット平面および1対の隣接する振幅の内の1つを具備する分割点を 選択し、これによって非DC項目を、絶対的大きさに基づいて第1と第2の範囲 内に分離するステップであり、前記第1の範囲が、変換結果の前記第2の範囲よ り値が大きい変換結果の値を有するステップと; (v)スカラー量子化器を用いて、前記第1の範囲内の値を符号化するステッ プと; (vi)ベクトル量子化器を用いて、前記第2の範囲内の値を符号化するステ ップと; (vii)結果得られたデータセットを無損失エントロピーエンコーダによっ てコーディングして、圧縮済みの画像データセットを得るステップと; 含むことを特徴とする方法。 2. 前記分割点が、前記スカラー量子化器および前記ベクトル量子化器を、 少なくとも2対の隣接するビット平面または1対の隣接する振幅によって定めら れる範囲に繰り返して適用し、前記適用の結果のそれぞれを比較し、前記結果が 事前定義された判断基準に最も近い分割点を選択することを特徴とする請求の範 囲第1項記載の方法。 3. 1つが大きなスパイクの曲線であり他方が浅いガウス曲線である2つの 曲線の結果としてヒストグラムが存在すると仮定し、また、前記2つの曲線の交 差点の外部に前記ヒストグラムの中心に対して対称的にしきい値を置くことによ って、前記分割点が選択されることを特徴とする請求の範囲第1項記載の方法。 4. 前記事前定義された判断基準が画像品質の測定基準に関して表現される ことを特徴とする請求の範囲第2項記載の方法。 5. 前記画像品質測定基準が平均二乗誤差測定基準であることを特徴とする 請求の範囲第4項記載の方法。 6. 前記画像品質測定基準がL1ノルム測定基準であることを特徴とする請 求の範囲第4項記載の方法。 7. 前記画像品質測定基準がピーク信号対ノイズ比率測定基準であることを 特徴とする請求の範囲第4項記載の方法。 8. 前記事前定義された判断基準が、選択された画像品質に対する圧縮済み 画像データのサイズに関して表現されることを特徴とする請求の範囲第2項記載 の方法。 9. 前記スカラー量子化器がゼロツリータイプのコーダであることを特徴と する請求の範囲第1項記載の方法。 10. 前記ベクトル量子化器が格子タイプのコーダであることを特徴とする 請求の範囲第1項記載の方法。 11. 前記ベクトル量子化器がイクイッツのPNNタイプのコーダであるこ とを特徴とする請求の範囲第1項記載の方法。 12. 決定されたRGB画像を冗長度の少ない色空間に変換する前記ステッ プが、平均、最大および最小の値を色空間の各対角線方向平面中に含む前記決定 されたRGB画像の色空間統計を決定して、較正される予定の前記決定済みRG B画像の再構成を可能とするステップを含むことを特徴とする請求の範囲第1項 記載の方法。 13. 前記分割点を選択する前に、1つ以上の事前決定された視覚感覚ルー ルに従って画像中の他の情報によってマスキングされたために人間の視覚システ ムでは知覚不可能な画像要素を表すデータを除去またはより厳密に量子化するこ とによって前記変換結果からデータが減損されることを特徴とする請求の範囲第 2項記載の方法。 14. 前記さざ波分解が前記画像のサブバンドに対して繰り返して実行され て、画像の相関関係をさらに減少させることを特徴とする請求の範囲第1項記載 の方法。 15. ステップ(ii)が、事前選択された幅を持つデータ境界で画像デー タをフレーミングするステップを含み、前記境界中のデータの値が、画像のエッ ジでの勾配から平滑にそして連続的に減少して、フレームの各エッジで平坦50 %グレイを表す値になるように選択されることを特徴とする請求の範囲第1項記 載の方法。 16. ステップ(iii)で、DC項目が直線状のアレイ中に置かれ、無損 失コーディングが、前記アレイの行毎に実行されるデルタコーディングであり、 各行中の第1のデータ要素が基準として非符号化され、前記行の符号化が完了す ると、基準として非符号化中である列中の第1の画素を持つ前記アレイの前記第 1の列をデルタコーディングする請求の範囲第1項記載の方法。 17. ステップ(vi)で、ベクトルの成分は、画素の三組が、ベクトルが 変換結果中の3つの画素を表すようにグループ分けされ、各画素が画像変換ピラ ミッドの1つのレベル(従ってスケールも)の3つの方位ブロックのそれぞれの 中の同じ空間的位置を表すように選択され、これによって、ピラミッドの3方位 分析の冗長度の相関を解除することを特徴とする請求の範囲第1項記載の方法。 18. ステップ(vi)で、ベクトルの成分が、子ベクトルと同じ2x2四 つ組が、これらの四つ組がY、CrおよびCbの空間中で同一に見えるような場 合に、それらがしきい値未満のデータを保持すれば、ベクトルとして定義される ように選択されることを特徴とする請求の範囲第1項記載の方法。 19. ステップ(vi)で、色差ベクトル成分が、変換空間中の所定の画素 位置におけるCr−Cb対に基づいて選択されて、2次元べクトルを生じさせ、 これによって、変換結果の色およびスケール/空間的位置の冗長度を減少させる ことを特徴とする請求の範囲第1項記載の方法。 20. 色差ベクトル成分が、所与の空間的位置での選択されたスケールの変 換結果の水平方向、垂直方向および対角線方向の各ブロックから取られたCr− Cb対に基づいて選択されて、6次元ベクトルを生じ、これによって変換結果の 色および縮尺/空間的位置の冗長度を減少させることを特徴とする請求の範囲第 18項記載の方法。 21. ステップ(vi)において、ベクトル量子化器によって処理される隣 接する画素が、平滑に変化するデータを表すものと識別され、また、両方向に丸 められてベクトルストリーム中でタグ付けされ、この結果、受信機がローカルモ ードで、自体のところにある汎用平滑化フィルタのオーバヘッド無しで、このよ うな画素を適切に最適に再平滑化できるように量子化され、これによって、エッ ジおよびテクスチャの平滑化で品質を損なうことなく、押し傷や切り傷を修復す ることを特徴とする請求の範囲第1項記載の方法。 22. ステップ(v)において、ゼロツリーコーダによって処理される予定 の、エッジ近傍の隣接する平滑データ画素が、両方向の丸め操作を受けてゼロツ リーデータ中で、平滑に再構成するに十分な精度で送出されることを特徴とする 請求の範囲第1項記載の方法。 23. ステップ(ii)において、色サブサンプリングを採用して、追加圧 縮を実行し、輝度データに対して色データを誤って位置合せしやすいこのような サブサンプリングが、逆さざ波変換実行後に輝度エッジで色を切断して再度位置 合せさせることによって受信機のところで補正されることを特徴とする請求の範 囲第1項記載の方法。 24. 従属パスが、類似の振幅を持つ従属データをベクトルコーディングで きるように実行され、これによって、以前のビット平面優性パス中の新たに有意 となった変換画素にとって、画素の絶対値(現行のビット平面から、ゼロツリー コーダに割り当てられた最低位のビット平面に至る)が従属データストリームに 一時に送られて、後続のベクトル量子化器によって処理されるベクトル中にエン トロピーコーディングまたはグループ分けされることを特徴とする請求の範囲第 9項記載の方法。 25. 単一の優性パスが、すべてのゼロツリーおよび、ゼロツリーコーダに 割り当てられたなんらかのビット平面中に存在するデータ根を持つ根アドレスを 符号化し、単一の従属パスが、階層、隣接画素丸め誤差および圧縮を考慮して決 定された十分な精度に有意データの大きさを符号化することを特徴とする請求の 範囲第9項記載の方法。 26. データ根が各階層中で三組の平均絶対的大きさで事前分類されて、エ ントロピーを減少させることを特徴とする請求の範囲第25項記載の方法。 27. ステップ(iii)で、無損失コーディングがデルタコーディングで あることを特徴とする請求の範囲第1項記載の方法。 28. ステップ(ii)が、第2のさざ波分解を、第1のさざ波分解に起因 する非DC項目の少なくとも最大レベルに対して実行してステップ(iv)が変 換結果に対して実行されるステップをさらに含むことを特徴とする請求の範囲第 1項記載の方法。 29. 前記冗長度の少ない色空間がY−Cr−Cb色空間であることを特徴 とする請求の範囲第1項記載の方法。 30. ディジタル画像を圧縮して、後続の再構成のための圧縮済み画像デー タセットを得る装置であって、前記装置が: RGB色空間からディジタル画像データを検出してこれを冗長度の少ない色空 間に変換する手段と; 前記冗長度の少ない色空間において前記画像の各色平面に対してさざ波分解を 実行して、DC項目および非DC項目を変換する手段と; 前記DC項目を無損失に符号化する手段と; 前記変換結果を符号と大きさから成るフォーマットに変換して、非DC項目を 絶対的大きさに基づいて第1と第2の範囲に分離する1対の隣接するビット平面 および1対の隣接する振幅の内の1つを含む分割点を選択する手段であり、前記 第1の範囲が変換結果の第1の範囲内の値より大きい変換結果の値を含む手段と 前記第1の範囲内の値を符号化するスカラー量子化手段と; 前記第2の範囲内の値を符号化するベクトル量子化手段と; 結果としてのデータセットを無損失に符号化して、圧縮済みの画像データセッ トを得る手段と; を具備することを特徴とする装置。 31. DC項目と非DC項目から成るさざ波変換されたディジタル情報を符 号化する方法であって、前記方法が: (i)DC項目に隣接する最高位レベルにある各画素が、次に低いレベルの対 応する2x2アレイの子画素として識別され、より下位のレベルに対して前記識 別を繰り返される、前記変換済みディジタル情報内に階層を確立するステップと ; (ii)符号化される階層の最高位レベルから最低位レベルに対して、優性パ ス中のレベル中で順に、対応する水平方向、垂直方向および対角線方向の画素の 各トリオを検査して、以前には有意ではないと見なされていた画素を識別し、現 行レベルの前記識別された画素のアドレスと符号を無損失に符号化して、画素ト リオの2x2の子アレイを各レベルに対して下方に最低位レベルに至るまで検査 して、これらの新たに有意である画素を識別するステップと; (iii)前記検査済み画素中のゼロツリー根を識別して、前記階層から、前 記階層からのゼロツリー根から従属する画素を除去するステップと; (iv)従属パス中で、優性パス中で識別されたすべての有意画素の大きさを 、優性パスが実行されたと同じ順序で出力するステップであり、前記出力された 大きさが事前選択された数値精度を有するステップと; (v)ステップ(ii)から(iv)を各レベルに対して、最下位レベルが処 理されるまで繰り返すステップと; を含むことを特徴とする方法。 32. ディジタル画像圧縮装置を実現するための内部に実現されたコンピュ ータ読み取り可能プログラムコード手段を有するコンピュータ使用可能媒体を具 備する製品であり、前記製品中の前記コンピュータ読み取り可能プログラムコー ド手段は: ディジタル画像データをRGB色空間から検出してこれを冗長度の少ない色空 間に変換するように前記コンピュータに命令するコンピュータ読み取り可能プロ グラムコード手段と; 前記冗長度の少ない色空間中の前記画像の各色平面に対してさざ波分解を実行 して、DC項目と非DC項目を変換するように前記コンピュータに命令するコン ピュータ読み取り可能プログラムコード手段と; 前記DC項目を無損失に符号化するように前記コンピュータに命令するコンピ ュータ読み取り可能プログラムコード手段と; 前記変換結果を符号と大きさから成るフォーマットに変換して、絶対値に基づ いて非DC項目を第1と第2の範囲に分離する1対のビット平面を含む分割点を 選択するように前記コンピュータに命令するコンピュータ読み取り可能プログラ ム手段であり、前記第1の範囲が変換結果の第2の範囲内の値より大きい変換結 果の値を含む手段と; スカラー量子化を実行して前記第1の範囲内の値を符号化するように前記コン ピュータに命令するコンピュータ読み取り可能プログラムコード手段と; ベクトル量子化を実行して前記第2の範囲内の値を符号化するように前記コン ピュータに命令するコンピュータ読み取り可能プログラムコード手段と; 結果としてのデータセットを無損失に符号化して圧縮済み画像データセットを 得るように前記コンピュータに命令するコンピュータ読み取り可能可能プログラ ムコード手段と; を具備することを特徴とする製品。
───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,DE, DK,ES,FI,FR,GB,GR,IE,IT,L U,MC,NL,PT,SE),OA(BF,BJ,CF ,CG,CI,CM,GA,GN,ML,MR,NE, SN,TD,TG),AP(GH,KE,LS,MW,S D,SZ,UG,ZW),EA(AM,AZ,BY,KG ,KZ,MD,RU,TJ,TM),AL,AM,AT ,AU,AZ,BA,BB,BG,BR,BY,CA, CH,CN,CU,CZ,DE,DK,EE,ES,F I,GB,GE,HU,IL,IS,JP,KE,KG ,KP,KR,KZ,LC,LK,LR,LS,LT, LU,LV,MD,MG,MK,MN,MW,MX,N O,NZ,PL,PT,RO,RU,SD,SE,SG ,SI,SK,TJ,TM,TR,TT,UA,UG, US,UZ,VN

Claims (1)

  1. 【特許請求の範囲】 1. ディジタル画像を圧縮して、後続の再構成のための圧縮済み画像データ を得る方法であって、前記方法が: (i)前記ディジタル画像がRGB色空間中でカラー画像であるか否かを判断 し、判断済みRGBカラー画像を冗長度の少ない色空間に変換するステップと; (ii)前記冗長度の少ない色空間中のさざ波分解を前記画像の色空間のそれ ぞれに対して実行して、DC項目および非DC項目の変換結果を得るステップと : (iii)前記DC項目を無損失にコーディングするステップと; (iv)前記変換結果を符号と大きさから成るフォーマットに変換して、隣接 する1対のビット平面および1対の隣接する振幅の内の1つを具備する分割点を 選択し、これによって非DC項目を、絶対的大きさに基づいて第1と第2の範囲 内に分離するステップであり、前記第1の範囲が、変換結果の前記第2の範囲よ り値が大きい変換結果の値を有するステップと; (v)スカラー量子化器を用いて、前記第1の範囲内の値を符号化するステッ プと; (vi)ベクトル量子化器を用いて、前記第2の範囲内の値を符号化するステ ップと; (Vii)結果得られたデータセットを無損失エントロピーエンコーダによっ てコーディングして、圧縮済みの画像データセットを得るステップと; 含むことを特徴とする方法。 2. 前記分割点が、前記スカラー量子化器および前記ベクトル量子化器を、 少なくとも2対の隣接するビット平面または1対の隣接する振幅によって定めら れる範囲に繰り返して適用し、前記適用の結果のそれぞれを比較し、前記結果が 事前定義された判断基準に最も近い分割点を選択することを特徴とする請求の範 囲第1項記載の方法。 3. 1つが大きなスパイクの曲線であり他方が浅いガウス曲線である2つの 曲線の結果としてヒストグラムが存在すると仮定し、また、前記2つの曲線の交 差点の外部に前記ヒストグラムの中心に対して対称的にしきい値を置くことによ って、前記分割点が選択されることを特徴とする請求の範囲第1項記載の方法。 4. 前記事前定義された判断基準が画像品質の測定基準に関して表現される ことを特徴とする請求の範囲第2項記載の方法。 5. 前記画像品質測定基準が平均二乗誤差測定基準であることを特徴とする 請求の範囲第4項記載の方法。 6. 前記画像品質測定基準がL1ノルム測定基準であることを特徴とする請 求の範囲第4項記載の方法。 7. 前記画像品質測定基準がピーク信号対ノイズ比率測定基準であることを 特徴とする請求の範囲第4項記載の方法。 8. 前記事前定義された判断基準が、選択された画像品質に対する圧縮済み 画像データのサイズに関して表現されることを特徴とする請求の範囲第2項記載 の方法。 9. 前記スカラー量子化器がゼロツリータイプのコーダであることを特徴と する請求の範囲第1項記載の方法。 10. 前記ベクトル量子化器が格子タイプのコーダであることを特徴とする 請求の範囲第1項記載の方法。 11. 前記ベクトル量子化器がイクイッツのPNNタイプのコーダであるこ とを特徴とする請求の範囲第1項記載の方法。 12. 決定されたRGB画像を冗長度の少ない色空間に変換する前記ステッ プが、平均、最大および最小の値を色空間の各対角線方向平面中に含む前記決定 されたRGB画像の色空間統計を決定して、較正される予定の前記決定済みRG B画像の再構成を可能とするステップを含むことを特徴とする請求の範囲第1項 記載の方法。 13. 前記分割点を選択する前に、1つ以上の事前決定された視覚感覚ルー ルに従って画像中の他の情報によってマスキングされたために人間の視覚システ ムでは知覚不可能な画像要素を表すデータを除去またはより厳密に量子化するこ とによって前記変換結果からデータが減損されることを特徴とする請求の範囲第 2項記載の方法。 14. 前記さざ波分解が前記画像のサブバンドに対して繰り返して実行され て、画像の相関関係をさらに減少させることを特徴とする請求の範囲第1項記載 の方法。 15. ステップ(ii)が、事前選択された幅を持つデータ境界で画像デー タをフレーミングするステップを含み、前記境界中のデータの値が、画像のエッ ジでの勾配から平滑にそして連続的に減少して、フレームの各エッジで平坦50 %グレイを表す値になるように選択されることを特徴とする請求の範囲第1項記 載の方法。 16. ステップ(iii)で、DC項目が直線状のアレイ中に置かれ、無損 失コーディングが、前記アレイの行毎に実行されるデルタコーディングであり、 各行中の第1のデータ要素が基準として非符号化され、前記行の符号化が完了す ると、基準として非符号化中である列中の第1の画素を持つ前記アレイの前記第 1の列をデルタコーディングする請求の範囲第1項記載の方法。 17. ステップ(vi)で、ベクトルの成分は、画素の三組が、ベクトルが 変換結果中の3つの画素を表すようにグループ分けされ、各画素が画像変換ピラ ミッドの1つのレベル(従ってスケールも)の3つの方位ブロックのそれぞれの 中の同じ空間的位置を表すように選択され、これによって、ピラミッドの3方位 分析の冗長度の相関を解除することを特徴とする請求の範囲第1項記載の方法。 18. ステップ(vi)で、ベクトルの成分が、子ベクトルと同じ2x2四 つ組が、これらの四つ組がY、CrおよびCbの空間中で同一に見えるような場 合に、それらがしきい値未満のデータを保持すれば、ベクトルとして定義される ように選択されることを特徴とする請求の範囲第1項記載の方法。 19. ステップ(vi)で、色差ベクトル成分が、変換空間中の所定の画素 位置におけるCr−Cb対に基づいて選択されて、2次元ベクトルを生じさせ、 これによって、変換結果の色およびスケール/空間的位置の冗長度を減少させる ことを特徴とする請求の範囲第1項記載の方法。 20. 色差ベクトル成分が、所与の空間的位置での選択されたスケールの変 換結果の水平方向、垂直方向および対角線方向の各ブロックから取られたCr− Cb対に基づいて選択されて、6次元ベクトルを生じ、これによって変換結果の 色および縮尺/空間的位置の冗長度を減少させることを特徴とする請求の範囲第 18項記載の方法。 21. ステップ(vi)において、ベクトル量子化器によって処理される隣 接する画素が、平滑に変化するデータを表すものと識別され、また、両方向に丸 められてベクトルストリーム中でタグ付けされ、この結果、受信機がローカルモ ードで、自体のところにある汎用平滑化フィルタのオーバヘッド無しで、このよ うな画素を適切に最適に再平滑化できるように量子化され、これによって、エッ ジおよびテクスチャの平滑化で品質を損なうことなく、押し傷や切り傷を修復す ることを特徴とする請求の範囲第1項記載の方法。 22. ステップ(v)において、ゼロツリーコーダによって処理される予定 の、エッジ近傍の隣接する平滑データ画素が、両方向の丸め操作を受けてゼロツ リーデータ中で、平滑に再構成するに十分な精度で送出されることを特徴とする 請求の範囲第1項記載の方法。 23. ステップ(ii)において、色サブサンプリングを採用して、追加圧 縮を実行し、輝度データに対して色データを誤って位置合せしやすいこのような サブサンプリングが、逆さざ波変換実行後に輝度エッジで色を切断して再度位置 合せさせることによって受信機のところで補正されることを特徴とする請求の範 囲第1項記載の方法。 24. 従属パスが、類似の振幅を持つ従属データをベクトルコーディングで きるように実行され、これによって、以前のビット平面優性パス中の新たに有意 となった変換画素にとって、画素の絶対値(現行のビット平面から、ゼロツリー コーダに割り当てられた最低位のビット平面に至る)が従属データストリームに 一時に送られて、後続のベクトル量子化器によって処理されるベクトル中にエン トロピーコーディングまたはグループ分けされることを特徴とする請求の範囲第 9項記載の方法。 25. 単一の優性パスが、すべてのゼロツリーおよび、ゼロツリーコーダに 割り当てられたなんらかのビット平面中に存在するデータ根を持つ根アドレスを 符号化し、単一の従属パスが、階層、隣接画素丸め誤差および圧縮を考慮して決 定された十分な精度に有意データの大きさを符号化することを特徴とする請求の 範囲第9項記載の方法。 26. データ根が各階層中で三組の平均絶対的大きさで事前分類されて、エ ントロピーを減少させることを特徴とする請求の範囲第25項記載の方法。 27. ステップ(iii)で、無損失コーディングがデルタコーディングで あることを特徴とする請求の範囲第1項記載の方法。 28. ステップ(ii)が、第2のさざ波分解を、第1のさざ波分解に起因 する非DC項目の少なくとも最大レベルに対して実行してステップ(iv)が変 換結果に対して実行されるステップをさらに含むことを特徴とする請求の範囲第 1項記載の方法。 29. 前記冗長度の少ない色空間がY−Cr−Cb色空間であることを特徴 とする請求の範囲第1項記載の方法。 30. ディジタル画像を圧縮して、後続の再構成のための圧縮済み画像デー タセットを得る装置であって、前記装置が: RGB色空間からディジタル画像データを検出してこれを冗長度の少ない色空 間に変換する手段と; 前記冗長度の少ない色空間において前記画像の各色平面に対してさざ波分解を 実行して、DC項目および非DC項目を変換する手段と; 前記DC項目を無損失に符号化する手段と; 前記変換結果を符号と大きさから成るフォーマットに変換して、非DC項目を 絶対的大きさに基づいて第1と第2の範囲に分離する1対の隣接するビット平面 および1対の隣接する振幅の内の1つを含む分割点を選択する手段であり、前記 第1の範囲が変換結果の第1の範囲内の値より大きい変換結果の値を含む手段と ; 前記第1の範囲内の値を符号化するスカラー量子化手段と; 前記第2の範囲内の値を符号化するベクトル量子化手段と; 結果としてのデータセットを無損失に符号化して、圧縮済みの画像データセッ トを得る手段と; を具備することを特徴とする装置。 31. DC項目と非DC項目から成るさざ波変換されたディジタル情報を符 号化する方法であって、前記方法が: (i)DC項目に隣接する最高位レベルにある各画素が、次に低いレベルの対 応する2x2アレイの子画素として識別され、より下位のレベルに対して前記識 別を繰り返される、前記変換済みディジタル情報内に階層を確立するステップと ; (ii)符号化される階層の最高位レベルから最低位レベルに対して、優性パ ス中のレベル中で順に、対応する水平方向、垂直方向および対角線方向の画素の 各トリオを検査して、以前には有意ではないと見なされていた画素を識別し、現 行レベルの前記識別された画素のアドレスと符号を無損失に符号化して、画素ト リオの2x2の子アレイを各レベルに対して下方に最低位レベルに至るまで検査 して、これらの新たに有意である画素を識別するステップと; (iii)前記検査済み画素中のゼロツリー根を識別して、前記階層から、前 記階層からのゼロツリー根から従属する画素を除去するステップと; (iv)従属パス中で、優性パス中で識別されたすべての有意画素の大きさを 、優性パスが実行されたと同じ順序で出力するステップであり、前記出力された 大きさが事前選択された数値精度を有するステップと; (v)ステップ(ii)から(iv)を各レベルに対して、最下位レベルが処 理されるまで繰り返すステップと; を含むことを特徴とする方法。 32. ディジタル画像圧縮装置を実現するための内部に実現されたコンピュ ータ読み取り可能プログラムコード手段を有するコンピュータ使用可能媒体を具 備する製品であり、前記製品中の前記コンピュータ読み取り可能プログラムコー ド手段は: ディジタル画像データをRGB色空間から検出してこれを冗長度の少ない色空 間に変換するように前記コンピュータに命令するコンピュータ読み取り可能プロ グラムコード手段と; 前記冗長度の少ない色空間中の前記画像の各色平面に対してさざ波分解を実行 して、DC項目と非DC項目を変換するように前記コンピュータに命令するコン ピュータ読み取り可能プログラムコード手段と; 前記DC項目を無損失に符号化するように前記コンピュータに命令するコンピ ュータ読み取り可能プログラムコード手段と; 前記変換結果を符号と大きさから成るフォーマットに変換して、絶対値に基づ いて非DC項目を第1と第2の範囲に分離する1対のビット平面を含む分割点を 選択するように前記コンピュータに命令するコンピュータ読み取り可能プログラ ム手段であり、前記第1の範囲が変換結果の第2の範囲内の値より大きい変換結 果の値を含む手段と; スカラー量子化を実行して前記第1の範囲内の値を符号化するように前記コン ピュータに命令するコンピュータ読み取り可能プログラムコード手段と; ベクトル量子化を実行して前記第2の範囲内の値を符号化するように前記コン ピュータに命令するコンピュータ読み取り可能プログラムコード手段と; 結果としてのデータセットを無損失に符号化して圧縮済み画像データセットを 得るように前記コンピュータに命令するコンピュータ読み取り可能可能プログラ ムコード手段と; を具備することを特徴とする製品。
JP10508277A 1996-06-24 1997-06-25 データを圧縮するための方法、装置およびシステム Pending JP2000513895A (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US08/668,753 US6865291B1 (en) 1996-06-24 1996-06-24 Method apparatus and system for compressing data that wavelet decomposes by color plane and then divides by magnitude range non-dc terms between a scalar quantizer and a vector quantizer
US08/668,753 1996-06-24
PCT/CA1997/000452 WO1998011728A1 (en) 1996-06-24 1997-06-25 Method, apparatus and system for compressing data

Publications (1)

Publication Number Publication Date
JP2000513895A true JP2000513895A (ja) 2000-10-17

Family

ID=24683580

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10508277A Pending JP2000513895A (ja) 1996-06-24 1997-06-25 データを圧縮するための方法、装置およびシステム

Country Status (6)

Country Link
US (1) US6865291B1 (ja)
EP (1) EP0908055A1 (ja)
JP (1) JP2000513895A (ja)
AU (1) AU3249697A (ja)
CA (1) CA2257694A1 (ja)
WO (1) WO1998011728A1 (ja)

Families Citing this family (83)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6549666B1 (en) * 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
US6229927B1 (en) * 1994-09-21 2001-05-08 Ricoh Company, Ltd. Reversible embedded wavelet system implementation
EP0944263A1 (en) * 1998-03-20 1999-09-22 Texas Instruments Incorporated Image compression
EP0973339A3 (en) * 1998-06-29 2001-03-28 Xerox Corporation Compression by splitting each word and applying lossy compression to least significant bits
US6526175B2 (en) * 1998-06-30 2003-02-25 Sarnoff Corporation Apparatus and method for packetizing significance-based information
JP4420415B2 (ja) * 1998-07-03 2010-02-24 キヤノン株式会社 符号化方法及び符号化装置
AU771764B2 (en) * 1999-02-04 2004-04-01 Quvis, Inc. Scaleable resolution motion image recording and storage system
US6895557B1 (en) 1999-07-21 2005-05-17 Ipix Corporation Web-based media submission tool
JP2003513529A (ja) * 1999-10-28 2003-04-08 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ウェーブレット分解に基づくカラービデオ符号化方法
US6732162B1 (en) 1999-11-15 2004-05-04 Internet Pictures Corporation Method of providing preprocessed images for a plurality of internet web sites
JP3335602B2 (ja) * 1999-11-26 2002-10-21 株式会社クリエイティブ・ブレインズ 思考系の解析方法および解析装置
JP4367880B2 (ja) * 1999-12-09 2009-11-18 キヤノン株式会社 画像処理装置及びその方法並びに記憶媒体
US6944350B2 (en) * 1999-12-17 2005-09-13 Utah State University Method for image coding by rate-distortion adaptive zerotree-based residual vector quantization and system for effecting same
AUPQ618500A0 (en) 2000-03-13 2000-04-06 Canon Kabushiki Kaisha Memory management of compressed images data
US6894699B2 (en) * 2000-07-21 2005-05-17 Mitsubishi Denki Kabushiki Kaisha Image display device employing selective or asymmetrical smoothing
DE10050951A1 (de) * 2000-10-13 2002-05-02 Image D C Gmbh Interfunctional Verfahren zur Erfassung, Organisation, Verarbeitung, Übertragung und Archivierung von ein- und mehrdimensionalen, digitalen Daten insbesondere stehender und bewegter Bilddaten
EP1225704A1 (en) * 2001-01-12 2002-07-24 STMicroelectronics S.r.l. "A process and system for compressing and decompressing digital information and computer program product therefor
JP2002325170A (ja) * 2001-04-24 2002-11-08 Canon Inc 画像処理装置及びその方法並びにプログラムコード、記憶媒体
US6697521B2 (en) 2001-06-15 2004-02-24 Nokia Mobile Phones Ltd. Method and system for achieving coding gains in wavelet-based image codecs
US6932725B2 (en) 2002-04-11 2005-08-23 Lifetime Products, Collapsible backboard support assembly for a basketball goal system
US7512277B2 (en) 2002-04-19 2009-03-31 Qinetio Limited Data compression for colour images using wavelet transform
US20030229773A1 (en) * 2002-05-28 2003-12-11 Droplet Technology, Inc. Pile processing system and method for parallel processors
KR20050049518A (ko) * 2002-10-03 2005-05-25 코닌클리케 필립스 일렉트로닉스 엔.브이. 미디어 신호 엔코딩 및 디코딩
JP4136951B2 (ja) * 2003-01-31 2008-08-20 株式会社リコー 画像処理装置、プログラム及び記憶媒体
US7129954B2 (en) * 2003-03-07 2006-10-31 Kabushiki Kaisha Toshiba Apparatus and method for synthesizing multi-dimensional texture
JP4017112B2 (ja) * 2003-04-30 2007-12-05 株式会社リコー 符号化データ生成装置及び方法、プログラム並びに情報記録媒体
US7391901B2 (en) * 2003-09-29 2008-06-24 Xerox Corporation Method for embedding color image information into a black-and-white image
US7801383B2 (en) * 2004-05-15 2010-09-21 Microsoft Corporation Embedded scalar quantizers with arbitrary dead-zone ratios
US7724979B2 (en) * 2004-11-02 2010-05-25 Broadcom Corporation Video preprocessing temporal and spatial filter
JP4449723B2 (ja) * 2004-12-08 2010-04-14 ソニー株式会社 画像処理装置、画像処理方法、およびプログラム
JP4618676B2 (ja) * 2005-04-28 2011-01-26 株式会社リコー 構造化文書符号の転送方法、画像処理システム、サーバ装置、プログラム及び情報記録媒体
US7676107B2 (en) * 2005-05-16 2010-03-09 Broadcom Corporation Method and system for video classification
US8422546B2 (en) 2005-05-25 2013-04-16 Microsoft Corporation Adaptive video encoding using a perceptual model
US7583849B2 (en) * 2005-07-25 2009-09-01 Microsoft Corporation Lossless image compression with tree coding of magnitude levels
US8059721B2 (en) 2006-04-07 2011-11-15 Microsoft Corporation Estimating sample-domain distortion in the transform domain with rounding compensation
US8503536B2 (en) * 2006-04-07 2013-08-06 Microsoft Corporation Quantization adjustments for DC shift artifacts
US20070237237A1 (en) * 2006-04-07 2007-10-11 Microsoft Corporation Gradient slope detection for video compression
US7974340B2 (en) * 2006-04-07 2011-07-05 Microsoft Corporation Adaptive B-picture quantization control
US8130828B2 (en) * 2006-04-07 2012-03-06 Microsoft Corporation Adjusting quantization to preserve non-zero AC coefficients
US7995649B2 (en) * 2006-04-07 2011-08-09 Microsoft Corporation Quantization adjustment based on texture level
US8711925B2 (en) * 2006-05-05 2014-04-29 Microsoft Corporation Flexible quantization
US20080018663A1 (en) * 2006-07-18 2008-01-24 Sitronix Technology Corp. Access structure for internal memory of driving control elements
JP4194614B2 (ja) * 2006-07-18 2008-12-10 キヤノン株式会社 画像処理装置および画像処理方法と情報処理装置
US7692647B2 (en) * 2006-09-14 2010-04-06 Microsoft Corporation Real-time rendering of realistic rain
JP4909003B2 (ja) * 2006-10-03 2012-04-04 キヤノン株式会社 画像処理装置及び方法
US9521431B2 (en) 2007-01-03 2016-12-13 Numeri Ltd. Method and a system for wavelet based processing
US8238424B2 (en) * 2007-02-09 2012-08-07 Microsoft Corporation Complexity-based adaptive preprocessing for multiple-pass video compression
US8498335B2 (en) * 2007-03-26 2013-07-30 Microsoft Corporation Adaptive deadzone size adjustment in quantization
US8243797B2 (en) 2007-03-30 2012-08-14 Microsoft Corporation Regions of interest for quality adjustments
US8442337B2 (en) * 2007-04-18 2013-05-14 Microsoft Corporation Encoding adjustments for animation content
US20080285868A1 (en) * 2007-05-17 2008-11-20 Barinder Singh Rai Simple Adaptive Wavelet Thresholding
US8331438B2 (en) * 2007-06-05 2012-12-11 Microsoft Corporation Adaptive selection of picture-level quantization parameters for predicted video pictures
KR101370288B1 (ko) * 2007-10-24 2014-03-05 삼성전자주식회사 이미지 신호의 압축 방법 및 장치
ES2322120B1 (es) 2007-10-26 2010-03-24 Consejo Superior De Investigaciones Cientificas Metodo y sistema para analisis de singularidades en señales digitales.
TWI388218B (zh) * 2007-10-30 2013-03-01 Nippon Telegraph & Telephone 影像編碼方法與解碼方法、其程式及記錄有程式的記錄媒體
TW200930044A (en) * 2007-12-28 2009-07-01 Altek Corp False color depressing method for digital images
US8179965B2 (en) * 2008-01-23 2012-05-15 Panasonic Corporation Moving picture coding method
US8189933B2 (en) * 2008-03-31 2012-05-29 Microsoft Corporation Classifying and controlling encoding quality for textured, dark smooth and smooth video content
US8897359B2 (en) 2008-06-03 2014-11-25 Microsoft Corporation Adaptive quantization for enhancement layer video coding
CN102119401B (zh) * 2008-08-08 2013-12-04 汤姆逊许可证公司 用于带状伪像检测的方法和设备
KR20100079121A (ko) * 2008-12-30 2010-07-08 주식회사 동부하이텍 이미지 인코더 및 이미지 인코딩 방법
KR20110017719A (ko) 2009-08-14 2011-02-22 삼성전자주식회사 비디오 부호화 방법 및 장치, 비디오 복호화 방법 및 장치
AU2013202015B2 (en) * 2009-08-14 2014-08-14 Samsung Electronics Co., Ltd Method and apparatus for encoding video, and method and apparatus for decoding video
KR101457396B1 (ko) * 2010-01-14 2014-11-03 삼성전자주식회사 디블로킹 필터링을 이용한 비디오 부호화 방법과 그 장치, 및 디블로킹 필터링을 이용한 비디오 복호화 방법 및 그 장치
US8582906B2 (en) * 2010-03-03 2013-11-12 Aod Technology Marketing, Llc Image data compression and decompression
CN105915753B (zh) 2010-10-18 2019-01-04 杜比实验室特许公司 对图像数据进行解码及对视频信号进行编码的方法和设备
WO2012088046A2 (en) * 2010-12-21 2012-06-28 Syndiant, Inc. Spatial light modulator with storage reducer
US8891894B2 (en) * 2011-09-30 2014-11-18 Apple Inc. Psychovisual image compression
TWI519133B (zh) * 2012-02-29 2016-01-21 新力股份有限公司 影像處理裝置及方法
GB2516021A (en) * 2013-07-05 2015-01-14 Canon Kk Method, device, and computer program for pre-encoding and post-decoding high bit-depth content in video encoder and decoder
US9204150B2 (en) * 2014-02-26 2015-12-01 Intel Corporation Techniques for evaluating compressed motion video quality
US10356410B2 (en) 2014-10-28 2019-07-16 Sony Corporation Image processing system with joint encoding and method of operation thereof
US9674554B2 (en) 2014-10-28 2017-06-06 Sony Corporation Image processing system with coding mode and method of operation thereof
US10063889B2 (en) 2014-10-28 2018-08-28 Sony Corporation Image processing system with conditional coding and method of operation thereof
US9357237B2 (en) 2014-10-28 2016-05-31 Sony Corporation Image processing system with bitstream reduction and method of operation thereof
US9357232B2 (en) 2014-10-28 2016-05-31 Sony Corporation Image processing system with binary decomposition and method of operation thereof
US9294782B1 (en) 2014-10-28 2016-03-22 Sony Corporation Image processing system with artifact reduction mechanism and method of operation thereof
CL2015002576A1 (es) * 2015-09-10 2016-05-06 Tecnologia Vvd Limitada Método de compresión de imagen y video por vectorización y un dispositivo ejecutor de dicho método en formato de circuito integrado o chip, para equipos móviles y fijos.
GB2545503B (en) * 2015-12-18 2020-04-08 Imagination Tech Ltd Lossy data compression
AU2017201760B2 (en) * 2017-03-15 2023-03-09 Canon Kabushiki Kaisha Method, apparatus and system for encoding and decoding video data
GB2567427B (en) * 2017-10-06 2020-10-07 Imagination Tech Ltd Data compression
US10395392B1 (en) * 2019-01-31 2019-08-27 StradVision, Inc. Learning method and learning device for strategic transforming RGB training image sets into non-RGB training image sets, to be used for learning object detection on objects of images in non-RGB format, by using cycle GAN, resulting in significantly reducing computational load and reusing data
US11856204B2 (en) * 2020-05-04 2023-12-26 Ssimwave Inc. Macroblocking artifact detection

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4152772A (en) * 1974-08-29 1979-05-01 The United States Of America As Represented By The Secretary Of The Navy Apparatus for performing a discrete cosine transform of an input signal
US4005411A (en) * 1974-12-30 1977-01-25 International Business Machines Corporation Compression of gray scale imagery to less than one bit per picture element
US4839721A (en) * 1984-08-28 1989-06-13 Polaroid Corporation Method of and apparatus for transforming color image data on the basis of an isotropic and uniform colorimetric space
GB2189106B (en) * 1986-04-14 1990-02-14 Philips Electronic Associated Image display
EP0339589A3 (en) * 1988-04-28 1992-01-02 Sharp Kabushiki Kaisha Orthogonal transform coding system for image data
JPH02100465A (ja) * 1988-10-06 1990-04-12 Sharp Corp 画像符号化方式
GB8914843D0 (en) * 1989-06-28 1989-08-16 British Aerospace A method of processing video image data for use in the storage or transmission of moving digital images
US5668646A (en) * 1990-02-06 1997-09-16 Canon Kabushiki Kaisha Apparatus and method for decoding differently encoded multi-level and binary image data, the later corresponding to a color in the original image
US5297170A (en) * 1990-08-21 1994-03-22 Codex Corporation Lattice and trellis-coded quantization
US5331414A (en) 1991-12-23 1994-07-19 Intel Corporation Method and apparatus for encoding a digital motion video signal using pyramid specific filtering
US5371544A (en) * 1992-02-07 1994-12-06 At&T Corp. Geometric vector quantization
CA2088082C (en) * 1992-02-07 1999-01-19 John Hartung Dynamic bit allocation for three-dimensional subband video coding
US5321776A (en) * 1992-02-26 1994-06-14 General Electric Company Data compression system including successive approximation quantizer
US5272529A (en) 1992-03-20 1993-12-21 Northwest Starscan Limited Partnership Adaptive hierarchical subband vector quantization encoder
EP0576763A1 (en) 1992-06-30 1994-01-05 International Business Machines Corporation Improved method for sub-band coding video signals and device for implementing said method
US5589994A (en) * 1992-08-21 1996-12-31 Mitsubishi Denki Kabushiki Kaisha Image recording method and apparatus with reduced error propagation
US5412741A (en) * 1993-01-22 1995-05-02 David Sarnoff Research Center, Inc. Apparatus and method for compressing information
WO1994023385A2 (en) * 1993-03-30 1994-10-13 Adrian Stafford Lewis Data compression and decompression
GB2281465B (en) * 1993-08-27 1997-06-04 Sony Uk Ltd Image data compression
US5509089A (en) * 1993-09-09 1996-04-16 Intel Corporation Method and system for encoding images using temporal filtering
US5377041A (en) * 1993-10-27 1994-12-27 Eastman Kodak Company Method and apparatus employing mean preserving spatial modulation for transforming a digital color image signal
US5727529A (en) 1994-01-14 1998-03-17 Walbro Corporation Pressure control valve for a fuel system
US5673191A (en) * 1995-04-10 1997-09-30 Atlantic Richfield Company Method and apparatus for identifying geological structures using wavelet analysis of potential fields
US5675701A (en) * 1995-04-28 1997-10-07 Lucent Technologies Inc. Speech coding parameter smoothing method
US5576548A (en) * 1995-06-05 1996-11-19 University Of South Florida Nuclear imaging enhancer

Also Published As

Publication number Publication date
EP0908055A1 (en) 1999-04-14
US6865291B1 (en) 2005-03-08
AU3249697A (en) 1998-04-02
WO1998011728A1 (en) 1998-03-19
CA2257694A1 (en) 1998-03-19

Similar Documents

Publication Publication Date Title
JP2000513895A (ja) データを圧縮するための方法、装置およびシステム
US6125201A (en) Method, apparatus and system for compressing data
Tzou Progressive image transmission: a review and comparison of techniques
US6359928B1 (en) System and method for compressing images using multi-threshold wavelet coding
JP3699425B2 (ja) 適応ブロック・サイズによる画像圧縮方法およびシステム
KR100926381B1 (ko) Golomb-rice 코딩을 사용한 dct 압축
JP3743384B2 (ja) 画像符号化装置及び方法、並びに画像復号装置及び方法
JPH04343577A (ja) データ圧縮装置及びデータ復元装置
KR20070083677A (ko) 고품질 광역 다중-레이어 이미지 압축 코딩 시스템
JP2005515727A (ja) 複合文書の圧縮のためのコーダに整合したレイヤ分離および補間
EP1461941A1 (en) Code matched layer separation for compression of compound documents
JP2002501709A (ja) ウェーブレットに基づくデータ圧縮を行う方法及び装置
US6804403B1 (en) Region-based scalable image coding
US7742521B2 (en) Method and system for processing signals via perceptive vectorial quantization, computer program product therefor
JP2004533181A (ja) デジタルイメージに対する選択的なクロミナンスデシメーション
US8023563B2 (en) Method and system for processing signals via perceptive vectorial quantization, computer program product therefor
CA2449709A1 (en) Interframe encoding method and apparatus
JP4215269B2 (ja) 領域ベースのスケーラブルな画像コーディング
Shah et al. A review of contemporary image compression techniques and standards
Markman et al. Hyperspectral image coding using 3D transforms
Akopian et al. Multibase transform coding for multispectral image compression
Kumar et al. Development of 2-D MRT based image compression techniques
Franques Wavelet-based embedded zerotree extension to color coding
Moury 2.2. 1 Interest of digital image compression
Ngadiran Rate scalable image compression in the wavelet domain