JP4303818B2 - 画像符号化方法及び装置 - Google Patents
画像符号化方法及び装置 Download PDFInfo
- Publication number
- JP4303818B2 JP4303818B2 JP01616999A JP1616999A JP4303818B2 JP 4303818 B2 JP4303818 B2 JP 4303818B2 JP 01616999 A JP01616999 A JP 01616999A JP 1616999 A JP1616999 A JP 1616999A JP 4303818 B2 JP4303818 B2 JP 4303818B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- coefficient
- pixel
- quantization
- image type
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
- H04N19/126—Details of normalisation or weighting functions, e.g. normalisation matrices or variable uniform quantisers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/60—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N19/00—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
- H04N19/10—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
- H04N19/102—Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
- H04N19/124—Quantisation
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Processing (AREA)
Description
【発明の属する技術分野】
本発明は、文書画像を走査、表現、再生するデジタルシステムに関する。特に、本発明はJPEGシーケンシャルモードデータシンタックス(sequential mode data syntax)内での適応量子化に関する。詳しくは、本発明は、異なる画像タイプのブロックに画像をセグメント化する方法に関し、本方法を用いると、人間の視覚性質に基づく情報を顕著に失わずに、より効率的に画像を圧縮することができる。
【0002】
【従来の技術】
JPEG(Joint Photographic Expert Group)アーキテクチャは、圧縮方法と見ることができ、多種多様なアプリケーションは、具体的な必要を満たす適切な圧縮システムをこの方法から規定することができる。JPEGは、画素データの符号化および復号に係わるだけであり、データの解釈になると、JPEGの範囲外であり、それは、JPEGを用いるアプリケーション側に任されている。
【0003】
JPEGの仕様は、幾つかの部分から成っており、可逆および非可逆両符号化方法に対するプロトコルもこれらに含まれている。可逆圧縮アルゴリズムは、ハフマン(Huffman)符号出力段階を有する予測/適応モデルを用い、情報のロスがないものである。JPEG不可逆圧縮アルゴリズムは、本発明が最も関心するところである標準シーケンシャルモードを含めて、図1に示されるように幾つかの段階を順次に行っていく。これらの段階が組み合わせられることによって、主に連続階調の画像を圧縮しながらも、最初の忠実度(フィデリティ)を殆ど損なわない圧縮器が形成される。一般に本明細書では簡単化のため、形容詞として用いられる「JPEG」という語は、普通、JPEGシーケンシャルモードデータシンタックスを意味する。すなわち、「JPEG**」などの形の用語は、JPEGシーケンシャルモードデータシンタックスに関する**であることを示す。例えば「JPEG準拠」と言えば、JPEGシーケンシャルモードデータシンタックスに準拠していることを意味する。
【0004】
圧縮法の中心は、1つの画像の各画像プレーン(例えば、色差値または輝度値)に行われる離散コサイン変換(DCT)である。単一プレーンの画像(例えば、グレイ画像)もあり、多レイヤすなわち多プレーンの画像(例えば、RGBまたはCMYK方式画像)もあることは周知の通りである。従って、理解されなければならないのは、本明細書では「画像」が、時として多レイヤ画像の単一プレーンについて用いられているということである。例えば、どの画像面内でも8×8画素のブロックの64個の値についてDCT演算を行うと、各々が64個の直交波形成分の振幅を表す64個の係数の集合が得られる。これらの係数全部で8×8画素ブロックの全64個の画素に対する値を規定する。上記64個の係数に逆DCTを行うと、8×8画素ブロックの元の64個の値が再生される。
【0005】
元の64個の値でなくこれら64個の係数を用いる利点は、これら係数の各々が、異なる空間周波数を示す直交波形の振幅を示すということである。滑らかなテクスチャのブロックは、画素と画素との間の変化が小さく、値がゼロである「高域周波数」DCT係数が数多く生じ易い。例えば、同じ値を有する64個の画素からなるブロックにDCT演算を行うと、値がゼロでない係数が1個と、値がゼロの係数が63個得られる。更に、上記係数を空間周波数に従って並べると、値がゼロの係数が並んだ長い列が得られる。
【0006】
ゼロの値が並んだ長い列を有するデータがあると、例えば、ハフマン(Huffman)タイプのエントロピー符号化を用いて大幅なデータ圧縮が可能となる。この理由で、(通常8×8の)画素ブロックにDCT演算を行う時、高い空間周波数に対する係数は、正確さを落として表すのが望ましい。これは、図2に示される量子化と呼ばれるプロセスで行われる。量子化は、基本的にはDCT係数の正確さを落とすプロセスである。正確さを落とすと言うことは極めて重要である。なぜなら、正確さが低いということは、大抵の場合、圧縮データのストリームのスループットがよくなることにつながるからである。JPEGアルゴリズムがデータを効果的に圧縮する理由の一つは、DCTブロックの大量の係数が、量子化の際に丸められたり、切り捨てられたりしてゼロの値になるということである。
【0007】
DCT係数は、これを、量子化値と呼ばれるゼロでない正の整数で割り、商の小数点以下を切り捨て、すなわち丸めて、最も近い整数(量子化されたDCT係数)にすることによって量子化される。量子化されたDCT係数を再生(逆量子化)するには、デコーダは今度はこの量子化値を掛ける必要がある。正確さが、ある程度は量子化の際に失われるので、再生されたDCT係数は量子化前の値の近似値となる。
【0008】
量子化の前に、DCT係数は、以下の図1に示される周知のジグザグ走査シーケンスを用いて一次元ベクトルの形に並べられる。最も低い周波数成分は、ゼロとラベル付けされた係数で表され、DC(直流)成分である。残りの係数はAC(交流)係数である。そして、それら残りの係数は、水平方向と垂直方向に左から右へ、上から下へと、それぞれ順番に配列され、後の方ほど高い周波数に対応する。DC係数は、一次元DPCM(差分パルス符号変調、Differential Pulse Code Modulation)技法を用いて符号化される。これは、現在のDC係数を、その直前のブロックのDC係数からの差に変換し、次いでエントロピー符号化を行うものである。ジグザグ走査のAC係数は、各々がゼロでない係数で終わるゼロ係数のラン(run)に分割される。次に、ハフマン符号が、ゼロ係数のランレングス(run length)とその次のゼロでないAC係数の大きさとの各々可能な組み合わせに割り当てられる。
【0009】
【表1】
画像の画像プレーンを圧縮するために、JPEGのプロトコルを用いると、エンコーダは、8×8量子化テーブル(Qテーブル)をデコーダに送られるデータに埋め込むことが可能となる。このQテーブルは、DCT係数各個を量子化するための異なる値を含むことができるが、これらの値は、人間の視覚システムに基づく原理を用いて、再生画像に生じる知覚上の歪みを最小限に抑えるように選択されている。JPEGシーケンシャルモードにおいて能力の最も低いレベルは、「ベースラインシステム」である。このシステムでは、ハードウェアの実装が最も単純にできることを目的としたものなので、各画像プレーンに対し、テーブルを1個だけ(ただし、画像プレーンが全部で何枚あろうとも最大で4個)データに埋め込み、デコーダへ伝送することができる。
【0010】
典型的なJPEGベースラインシーケンシャル技術では、図1〜3に示されるように、ソース画像の8×8画素ブロックの画素値(p00,p01,.....,pxy,......,p77)102を離散コサイン変換(DCT)104Fにかける。得られたDCT係数は、上の表1に示されるようなDCT係数マトリックス(S00,S01,.....,Sxy,......,S77)104の形に並べられる。量子化処理108Fが、Qテーブル(Q00,Q01,.....,Qxy,......,Q77)106を用いてDCT係数104に対して行われる。ここでは、各Sxyを対応するQxyで割り、商の小数点以下を四捨五入して最も近い整数とすることによって量子化されたDCT係数(Sq00,Sq01,.....,Sqxy,......,Sq77)108が得られる。量子化されたDCT係数108は、次いでハフマン符号テーブル112を用いてエントロピーエンコーダ110によって符号化され、得られた符号化(圧縮)されたデータ114は、伝送されたり、必要な時が来るまで記憶されたりする。必要な時には、符号化データは、復号され、逆量子化され、逆DCTにかけられ、ソース画像の8×8画素ブロック102(すなわちその近似)が再生される。
【0011】
JPEG準拠の圧縮を行うステップは、図3に総括される。ステップS302で画像が走査され、画素群が8×8画素ブロックに纏められる。ステップS304で、離散コサイン変換(DCT)がブロックに行われる。ステップS306でDCT係数が量子化され、ステップS308で画素ブロックの符号化が行われる。このプロセスを画像の全てのブロックに対して繰り返して行い、最終的に画像全体に対してJPEG符号化が行われる。
【0012】
JPEGが最初に採用されたのは、ある画素から次の画素への変化がスムースな画素が多く含まれている写真を符号化するためであった。しかし、これは他の画像タイプ、例えば、画素と画素との間の変化が鋭いという特徴があるテキストにも使用することができる。より粗い量子化(すなわち、より大きい量子化値を用いる)を用いて、スムースな画素変化に特徴がある画像を圧縮し、なおかつ知覚される画像の品質を不当に劣化させないように改良を行うことができるが、その一方でテキストには精細な量子化が必要となる。従って、画像品質と圧縮との間の許容可能なバランスをとる最適な量子化Qテーブルとは、画像のタイプが異なれば異なるものである。
【0013】
最適なQテーブルは、画像タイプが変われば変わる。極めて鋭い画素値の変化を有する画像(例えば、テキスト画像)は、正確さの劣化に対する知覚上の許容度が極めて低い。例えば、ピクトリアル画像タイプに最適な粗い量子化Qテーブルを用いると、圧縮データを復号した時、画像には人間の目に知覚できるアーティファクトが含まれ易い。一方では、スムースに画素値が遷移する部分を有する他の画像タイプ、つまり極めて詳細な画像(ディテール画像。例えば、草原の写真)は、より大きな圧縮を行っても(これに対応して正確さは、より損なわれるが)、人間の目に知覚できるアーティファクトが現れない。
【0014】
【発明が解決しようとする課題】
最適なQテーブルは画像のタイプが異なれば(テキスト、ハーフトーン、ピクトリアル(写真等の連続階調あるいはそれに近い画像)、その他)異なるので、圧縮される画像のタイプに依存して異なるQテーブルを選んでデコーダへ送ることができる。もっとも、多くのアプリケーション(例えば、コピー機やプリンタ)では、このオプションは、実装にかかるコストが加わるので望ましくはない。従って、例えば、大抵のコピー機では、コピーされる文書の画像タイプが何であっても、テキストに最適なQテーブルを常に用い、出力されるコピーに人間の目で認識できるアーティファクトが生じるのを最小限に抑えている。しかし、コピー機に「画像タイプ」を選択する機能を付与し、コピーする画像のタイプをユーザ側でマニュアルで選択することができるようにすることも可能である。勿論、これとて、文書の実際の画像タイプを判別するのに、ユーザが常に正しいと仮定している。別の方法として、コピーされる文書各々の画像タイプを自動的に決定し、最適なQテーブルを選択する手段を、コピー機や他の画像圧縮器に備えさせることも可能である。
【0015】
しかし、文書が複数の異なる画像タイプから構成されている時は、そのような方式を実現するのは複雑である。典型的な文書は、テキスト(すなわち、鋭いエッジがある)領域とピクトリアル領域とを組み合わせたものを同じページに含むものである。例えば、文書に写真があって、その下に説明用のテキストの部分が含まれていることがある。文書が複数の画像タイプで構成され、しかも1個のQテーブルをこれら全ての画像タイプ用に選択しなければならない場合は、テキストに最適なQテーブルを選ぶべきであって、そうすれば画像全体に対して高認知品質が得られる。
【0016】
従って、画像タイプが決められたブロックに対しては、その画像タイプに最適なQテーブルを用いてDCT係数を量子化できるようにするのが有利であろう。これを行う一つの方法としては、その画像タイプに応じた異なるQテーブルを用いて各ブロックを量子化し、そのテーブルをデコーダに渡すことであろう。そうすれば、各ブロックを最小の認知誤差で再生できる。また、このようなシステムは、各ブロックに用いられた量子化テーブルについてエンコーダから情報を受け取ることができる非標準型のデコーダを必要とする。しかし残念ながら、現在のJPEG準拠のデコーダではこれができない。なぜなら、上記で説明された通り、ベースラインJPEGプロトコルでは、画像プレーン当たりQテーブル1枚(画像当たりでは最大4枚まで)をデコーダに渡すことが可能にすぎないからである。従って、画像タイプが混在している文書に現行のシーケンシャルJPEGアルゴリズムを用いたのでは、圧縮画像のサイズと圧縮画像から再生することができる画像の品質とのバランスは良いものにならない。
【0017】
適応量子化は、上手く実装されれば、所与の速度で得られる画像品質を顕著に改良することが可能である。適応量子化を用いる場合は、ある値をデコーダに渡すと、デコーダの方では、その値により、復号されたデータの逆量子化のために使用しているQテーブルを修正する。最近、JPEG委員会は勧告T.84を承認した。この勧告では、ある一つのスケーリングファクター(scaling factor)をデコーダに渡すことが可能となり、デコーダは、これを用いてQテーブルの値を全て線形的にスケーリングする。業界では、この方法を実装する努力はそれほどはらってこなかったが、それは、1つのスケーリングファクターを用いて不当に画質を劣化させずに圧縮しようとしても、圧縮に関してそれほどの改善が達成できるものではないと理解していたからである。これは、線形的なスケーリングは高い周波数と低い周波数の双方の係数に等しい影響を与えるからである。しかし、知覚される画質は、高い周波数の係数についての変化の方が低い周波数の係数に対する変化よりも影響が少ないので、圧縮に関して顕著な改良を、知覚される画質を不当に劣化させずに行うには、低い周波数の係数に対する量子化ファクターよりも、高い周波数係数に対する量子化ファクターを大きくすることによってのみ達成できる。
【0018】
【課題を解決するための手段】
本発明を用いると、エンコーダは、画像タイプに最適化された量子化テーブルを必要な数だけ実質的に用い、画像内の異なる画素ブロックの異なる画像タイプに基づく画像を符号化することが可能となる。この場合、適切な量子化テーブルの選択は、DCT係数の解析、若しくは画素ブロック自体の空間領域での画素値変化の解析によって定まる。しかし、デコーダへ送られるテーブルの数は、JPEG「ベースライン」モデルに準拠しているので、標準JPEGデコーダを画像再生に用いることができる。
【0019】
本発明のより詳細な態様の一つでは、最初に、画素値の8×8ブロックが解析され、各ブロックが予め定義された異なる複数の画像タイプのうちのあるタイプであるか、あるいは別のタイプであるか、分類が行われる。この解析の際、そのような各ブロックの空間領域での生データ、または各ブロックの画素値の離散コサイン変換(DCT)表現のいずれかが用いられる。次に、これら画像タイプが決定された各画素ブロックに対するDCT値が、非線形に閾値処理されたり、あるいは画素ブロック各個が示す画像タイプについて最適化された1セットのファクターで修正されたりして、1セットの修正されたDCT値が得られる。次に、この修正されたDCT値セットが、テキストタイプ画像について最適化されている量子化テーブルに従って量子化される。次に、このテーブルが、量子化されたDCT値と一緒に、標準JPEGシーケンスモードデータシンタックスに準拠してデコーダへ送られる。このプロセスは、テキストタイプ画像ブロックを処理する際には、DCT値の量子化前の閾値処理/修正処理をバイパスすることによって更に強化することができる。
【0020】
テキストに最適化された量子化テーブルは、「精細」量子化テーブルと称されるテーブルの例である。しかし、より一般的には、精細量子化テーブルとは、比較的小さい量子化ファクターでできたテーブルを称する。
【0021】
本発明は、画像を表すデータを符号化して、デコーダが画像を再生できる出力データを作成する方法であって、前記画像の少なくとも1つのプレーンの画像信号データであって、各々が複数の画素行及び画素列についてのデータを有する第一画素ブロックと第二画素ブロックとを含む画像信号データを入力するステップと、第一画素ブロックに変換を行って第一係数を求めるステップと、第一画素ブロックの解析に基づいて第一画像タイプを求めるステップと、前記第一画像タイプの画像を表す係数を量子化するのに最適化された第一修正テーブルを求めるステップと、前記第一画像タイプとは異なる基本画像タイプに変換を行うことによって得られる基本画像係数を量子化するのに最適化された精細量子化テーブルであって、前記第一修正テーブルとは異なる精細量子化テーブルを求めるステップと、前記第一修正テーブルと前記精細量子化テーブルとの双方に基づいて前記第一係数を修正することによって第一修正係数を求めるステップと、前記デコーダが前記画像を再生できる出力データであって、前記第一修正係数と前記精細量子化テーブルに関する情報とを示すデータを含むが、前記第一修正テーブルの情報は含まない出力データを生成するステップとを含むことを特徴とする。
【0022】
また、本発明の好適な態様は、前記第一修正係数を得るステップが、前記第一修正テーブルに基づいて第一係数を閾値処理して、第一閾値処理係数を得るステップと、前記精細量子化テーブルに基づいて前記第一閾値処理係数を量子化するステップと、を含むことを特徴とする。
【0023】
また、本発明の好適な態様は、前記第二画素ブロックに変換を行って、第一係数とは異なる第二係数を求めるステップと、前記第二画素ブロックの解析に基づいて第一画像タイプ及び基本画像タイプのいずれとも異なる第二画像タイプを求めるステップと、前記第二画像タイプの画像を表す係数を量子化するのに最適化された第二修正テーブルであって、前記第一修正テーブル及び前記精細量子化テーブルのいずれとも異なる第二修正テーブルを求めるステップと、前記第二修正テーブルと前記精細量子化テーブルとの双方に基づいて前記第二係数を修正することによって第二修正係数を得るステップと、 を更に含み、前記出力データが、前記第二修正係数を示すデータを更に含むが、前記第二修正テーブルについて記載する情報は含まないことを特徴とする。
【0024】
また、本発明の好適な態様は、前記第一画素ブロックの解析に基づいて第一画像タイプを求めるステップが、複数の画素行及び画素列についてのデータに対する空間領域解析によってそれら画素行及び画素列とについてのテクスチャ値を得るステップと、ヒストグラム値を計算することにより、それら画素行及び画素列について得られた前記テクスチャ値の数値的な分布を求めるステップと、前記テクスチャ値の分布に基づいて第一画像タイプを決定するステップと、を含むことを特徴とする。
【0025】
また、本発明に係る画像符号化装置は、画像の1プレーンのブロック状領域を示すデータを受け取り、これらデータに変換を行うことにより、前記領域を表すデータに対応する変換係数を得る変換モジュールと、(1)前記変換モジュールによって得られた変換係数及び(2)前記領域を表すデータの空間領域解析のいずれか一方に基づいて、前記ブロック状領域を第一画像タイプであると特徴付けるセグメント化器と、変換モジュールから変換係数を受け取り、(1)第一画像タイプを量子化するのに最適化された第一量子化テーブル及び(2)第一画像タイプとは異なる基本画像タイプを量子化するのに最適化された精細量子化テーブルの両方に基づいて前記変換係数を修正することによって修正係数を得る修正量子化器と、量子化された係数を、前記精細量子化テーブルを表すが前記第一量子化テーブルは表さない情報と共に出力する出力モジュールとを備える。
【0026】
【発明の実施の形態】
以下に記載されるこの装置と方法は、処理コストと画像品質とが共に重要なリアルタイムデジタル文書システムに使用するのに好適であり、ベースラインシーケンシャルDCT符号化用の標準JPEG圧縮データシンタックス内でセグメント化と適応量子化を行う手順を提供する。本発明を用いて作成された圧縮データを復号するには、標準シーケンシャルJPEGデコーダを用いることができるので、適応量子化を復号処理に埋め込む必要はない。
【0027】
以下に開示の本発明の態様は、画像を標準フォーマットにコンパクトに符号化し、オリジナルの画像のビジュアル品質を実質的に維持する低コストのシステムを提供するものであって、記憶または伝送用のどんなデジタル画像化システムにも適用できる。本発明は、画像処理装置、例えば、デジタルコピー機、マルチファンクション機(いわゆる複合機)、カラーファックス、インターネットファクス、文書記憶装置、スキャン装置などの記憶コストを低減し、伝送時間を短縮することができる。
【0028】
上記の目的を達成するために、画素ブロックのテクスチャすなわち「煩雑さ(busyness)」に基づいて、画像を複数の異なる画像タイプのブロックへとセグメント化する方法が本明細書に開示される。DCT係数から生成される特徴に基づいて異なる画像タイプのブロックへと画像をセグメント化する方法も開示される。また、これらのセグメント化方法は、各画像タイプに対して、異なった、より適切な描画方法を用いることによって、プリンタ、コピー機などの再生画像品質を改良するのにも用いることができる。以下に記載のように、いずれのセグメント化方法も、具体的なアプリケーションの要求に応じ、JPEGベースラインシーケンシャルデコーダに合わせたDCT係数適応量子化処理のために用いることも考えられる。
【0029】
図4と図5は、本発明のセグメント化および適応量子化技術を用いるJPEGベースラインシーケンスモード準拠の圧縮スキームを示す。このセグメント化および量子化修正機能は、標準JPEGエンコーダと一緒に用いることにより、強力な圧縮装置となり、テキストとピクトリアル(写真等の連続階調画像、又はそれに近い画像)との混合画像を含む文書を、以下に記載のように、高品質、高圧縮率のJPEGストリームまたはファイルに圧縮することができる。以下の説明は、画像の一つのプレーンだけに焦点を当てて簡略化したものであり、レイヤが複数ある画像の場合、その各レイヤのプレーンには実質的に同じ説明が当てはまることは、以下の説明からも理解されよう。
【0030】
図4と図5を参照すると、本発明のJPEG圧縮では、画素ブロック102に従来のDCT処理104Fを行い、DCT係数(S00,S01,.....,Sxy,......,S77)104を得る。次に、以下に記載のように、画素ブロック102に適用した空間領域セグメント化技術またはDCT係数104に適用した周波数領域セグメント化技術のいずれかを用いて、セグメント化406Fを行う。次に、DCT係数104には、修正量子化408Fが行われる。修正量子化408Fは、本態様では、セグメント化手順406Fの結果に従って選択または修正された画像タイプ依存量子化修正テーブル(Q*テーブル)に基づいてDCT係数104の閾値処理407Fを行うことと、JPEGデコーダへ送られる1つの量子化テーブル(Qテーブル)406(以下に記載の態様ではテキスト用に最適化されたQテーブル(テキスト最適化Qテーブルと呼ぶ))を用いて、閾値処理されたDCT係数(S* 00,S* 01,.....,S* xy,......,S* 77)507を量子化108Fすることから構成される。次いで、修正された量子化DCT係数(Sq* 00,Sq* 01,.....,Sq* xy,......,Sq* 77)508は、従来のやり方でハフマン符号テーブル112を用いてエントロピーエンコーダ110によって符号化される。その結果得られた符号化圧縮データ114は、伝送されたり、あるいは必要な時が来るまで記憶されたりする。
【0031】
セグメント化は、周波数領域または空間領域のいずれでも行われる。セグメント機能406Fは、各8×8画素のブロックを画像タイプのカテゴリ、例えば、「ラインアート(線図:lineart)」(例えば、テキスト)または「ディテール(detailed)」(例えば、ハーフトーン)など、に分類する。空間領域のセグメント化は、DCT係数から得られる特徴に基づいた周波数領域のセグメント化よりも正確ではあるが、計算が多い。以下では、空間領域のセグメント化を最初に説明し、周波数領域でのセグメント化はその後で説明する。画像をセグメント化する以下の方法(ルール)は、本発明の特定の態様に関するものである。これに関する他の変形も容易に考えることができ、これも本発明の範囲に含まれる。
【0032】
画像タイプ別に画像の画素ブロックをセグメント化することは、各画像の画素ブロックをテクスチャ(空間領域における画素値の変化)で分類することによって行われる。この方法は、8×8画素の各ブロックの「煩雑さ」を識別するものであり。大変広い範囲の画像のクラスについて信頼性があり、しかも本方法の大部分はハードウエアに実装して低コストのリアルタイムセグメント化が実現できるほど単純である。
【0033】
セグメント化器の仕事は、画素ブロックを画像タイプで分類することである。タグは、画像タイプを識別すなわち記述するためのものである。タグは、例えば、ブロックを名前、例えば「ラインアート」や「ディテール」などで、分類すなわち記述するラベルである。また、タグは、ブロックの煩雑さを記述する値または特徴セットでもよい。後者の方が前者より正確である。なぜなら、ブロックには、複数の画像タイプの部分が含まれ得るからである。タグ値が先験的(ア・プリオリ)に知られている画像セットを用いることによって、タグを計算するためのルールセットを作り出すことができる。JPEGと互換性を持たせるために、そして計算と記憶とのコストを低減するために、入力画像の8×8画素のブロック全部に対して特徴を計算する。
【0034】
テクスチャは、画像の基本的な性質であり、領域同士を区別するのに重要である。直感的に言えば、テクスチャとは、単に小さなスケールの柄であり、画像に対し、いくぶん「煩雑な」感じを与える模様である。フラット(flat:平坦)領域は、実質的に特徴が無く、テクスチャ値が最も小さい。コントーン(contone:連続階調)領域は、ある画素から隣の画素までに値にスムースな変化がある領域であり、より高いテクスチャ値を有する。鋭い値の変化が繰り返すラインアート領域(例えば、テキスト)が、この次に来る。最後に、ディテール領域は、最高のテクスチャ値を有する。なぜなら、ハーフトーンすなわち誤差拡散ドット(すなわち例えば、草原の写真の一部)が存在するからである。領域群をテクスチャで区別する多様なアルゴリズムを本発明で用いることができる。以下に記載の方法では、隣接する画素同士の間での、閾値処理された二階差分を用いてテクスチャを決定する。
【0035】
行テクスチャおよび列テクスチャは、図6に示されるように、それぞれ水平方向および垂直方向に沿って定義された一次元テクスチャである。空間セグメント化法の態様の一つでは、画像のu行v列にある8×8画素のブロックに関するテクスチャヒストグラム(Histuv)が、行または列の煩雑さの指標を与える一次元の行テクスチャ関数と列テクスチャ関数(前者をRT、後者をCTと称する)から得られる。次に、このヒストグラムを画像タイプタグ(Tuv)に対応づける。Tuvは、区間[0 1]の間のファジー数であり、ブロックの煩雑さの程度を示す画像タイプ識別情報である。次に、新しいQ*テーブルをTuvに基づいて作成すなわち選択する。ブロックの煩雑さTuvは、Histuvのある関数として発生することができるが、テクスチャヒストグラム自体をQ*テーブルを作成・選択するのに用いることもできる。
【0036】
本明細書で議論される態様では、8画素の行または列に対するテクスチャヒストグラムに入る数は、0と12の間の範囲である。実際上はテクスチャヒストグラムに入る数は、普通、偶数の整数であるから、RTとCT値を各々2で割り、小数点以下を切り捨てる。だから、この場合テクスチャヒストグラムに入る数は0と6の間の範囲である。こうすると、必要なレジスタの数が殆ど半分になる。図14は、こうして得られた7値のテクスチャヒストグラム(Histuv)を、異なる複数の画像タイプを代表する8×8画素ブロックについて示したものである。
【0037】
別の方法としては、ブロックの煩雑さTuvは、画素ブロックの行テクスチャRTと列テクスチャCTの個々の関数として、例えば、これらを全部まとめて平均することなどにより、発生することができる。ヒストグラム法を使う態様を一つと、非ヒストグラム法を使う態様を一つとを以下に記載する。もっとも、以下に記載のアルゴリズムを変形した多くの異なる態様も実現することができる。
【0038】
以下に記載の本発明の態様を参照するが、行テクスチャ関数と列テクスチャ関数は次のように定義される。ブロック中の1×N画素の行iの各々に対して、順に並んだ画素値p(i,0),p(i,1),...,p(i,j),...、p(i,N−1)同士の差dr(i,0),dr(i,1),...,dr(i,j),...、dr(i,N−2)がまず計算される。ここでdr(i,j)は「p(i,j+1)−p(i,j)」と定義される。各dr(i,j)は、図7に示されるように量子化され、これによりテクスチャ計算に対するバックグラウンドノイズの影響を低下させる。この量子化処理の出力であるqr(i,j)は、−1、0、+1のいずれかである。qr(i,j)は、dr(i,j)の値が−e未満の時は−1、−eとeとの間の時は0、+eを超えるときは+1である。パラメータeは、テクスチャの計算において無視すべき画素間ノイズの尺度である。このようなバックグラウンドページノイズを無視しないと、画像全体が高テクスチャを有することになり、異なる領域同士を区別するテクスチャ関数の能力が著しく損なわれる。
【0039】
行テクスチャ(RT)計算の最後のステップは、隣り合う値qr(i,j)同士の差の絶対値の総和を計算することである。すなわち、
【数1】
RT=Σ|qr(i,j+1)−qr(i,j)|
行テクスチャ値RTが、画素ブロックの各行iについて計算され、同様に、列テクスチャ値CTも画素ブロックの各列jについて計算される。ここで、
【数2】
dc(i,j)=p(i+1,j)−p(i,j)
dc(i,j)→qc(i,j)(量子化)
CT=Σ|qc(i,j+1)−qc(i,j)|
である。
【0040】
このヒストグラム法に替わる方法として、全部で16個のRTとCTテクスチャ値をブロックに対して平均し、この結果を(0から1までの値に)規格化することによって、画像のu行v列における画素ブロックに対して一つのテクスチャ値Tuvを計算することができる。Tuvを決める二つの方法は、図8〜11を参照して説明される。もっとも、本発明ではいずれの方法でも行うことができることを理解されたい。
【0041】
さて、テクスチャ決定を図8を参照して説明する。ステップS802では、テクスチャ決定のためのヒストグラム法が用いられている場合、ブロックのヒストグラム配列H[]の7個の値が0に初期化される。ヒストグラム法が用いられていない場合は、全テクスチャ値のレジスタTが0に初期化される。
【0042】
ステップS804で、行インデックスiが0に初期化される。ステップS806で、画素ブロックの行iに対する行テクスチャRTが、図9を参照して後に説明されるように計算される。ステップS808で、ヒストグラム法が用いられている場合H[t]が増分される。ここで、tは行iの行テクスチャRTに対応する。この態様では、ヒストグラムH[]は、配列に7個の値が入り、最大行テクスチャRTが12だから、行テクスチャRTを2で割って、答えの小数点以下を切り捨てて、すなわち、t=Int(RT/2)として、H[t]を算出する。ヒストグラム法が用いられていない場合、ステップS808でブロックのテクスチャレジスタTが、画素ブロック行iの行テクスチャRTだけ増加される。
【0043】
ステップS810で、iがN−1未満である場合は、iがステップS812で増分され、プロセスはステップS806へ戻り、次の行iに対する行テクスチャRTを計算する。ステップS810でiがN−1未満でない場合、これは、画素ブロック中の行全ての行テクスチャRTが計算されてしまい、その結果がヒストグラム配列又はブロックのテクスチャレジスタTに反映されていることを意味する。この場合、プロセスはステップS814へ進み、列インデックスjがゼロに初期化され、該画素ブロックに対する列テクスチャ値CTの計算が開始される。次に、プロセスはステップS816へ進む。
【0044】
ステップS816で、画素ブロックの列jに対する列テクスチャCTが、図10を参照して後に説明されるように計算される。ステップS818でヒストグラム法が用いられている場合、H[t]が増分される。ここでt=Int(CT/2)である。ヒストグラム法が用いられていない場合、ステップS818でブロックのテクスチャレジスタTが、画素ブロック列jの列テクスチャCTだけ増加される。
【0045】
ステップS820で、jがN−1未満である場合は、jがステップS822で増分され、プロセスはステップS816へ戻り、次の列jに対する列テクスチャRTを計算する。ステップS820でjがN−1未満でない場合は、全ての行テクスチャRTと列テクスチャCTとが計算され終わり、その結果がヒストグラム配列Histuv又はブロックテクスチャレジスタTに総和されたことになるので、プロセスはステップS824へ進む。
【0046】
ステップS824で、画像のu行v列にある画素ブロックの「煩雑さ」タグTuvが選択すなわち計算される。ヒストグラム法が用いられている場合、Tuvは、例えば、図11を参照して後に説明されるように、全ブロックヒストグラムの関数として定義される。ヒストグラム法が用いられていない場合、煩雑さTuvは、Tを192(RT及びCTの最大値(12)と画素ブロック中の列と行の数の和(16)との積)で割ることにより、0から1までの値に規格化される。
【0047】
さて、本発明の態様の一つに従って、行に沿ってテクスチャを計算する方法を図9を参照して説明する。ステップS832で、行テクスチャ値RTと列インデックスjがゼロに初期化される(行インデックスiは図8に示される呼出元ルーチンで設定されている)。ステップS834で、画素ブロック行i中の隣接する画素値(列j+1とj)の間の画素値の差分dが計算される。
【0048】
次に、画素値の差分dが次のように量子化される。ステップS836で、dがeより大きい場合は、次にステップS838で、量子化された画素値差分q(j)が+1に等しいと設定され、プロセスはステップS846へ進む。dがe以下の場合はプロセスはステップS840に続く。ステップS840で、画素値差分d(j)が−eより小さい場合は、次にステップS842で、量子化された画素値差分q(j)が−1に等しいと設定され、プロセスはステップS846へ進む。ステップS840で、画素値差分d(j)が−eより小さくない場合は、次にステップS844で量子化画素値差q(j)は0に等しいと設定される。量子化画素値差q(j)がステップS838、S842、またはS844で設定されてしまうと、プロセスはステップS846に移行する。
【0049】
ステップS846でj=0の場合、プロセスはステップS850へ進む。そうでない場合は、ステップS848で、行テクスチャ値RTは、現在の量子化画素値差分q(j)とその前の量子化画素値差分q(j−1)との差の絶対値だけ増加される。次にプロセスはステップS850に続く。
【0050】
ステップS850でjがN−2を超えていない場合はjはステップS852で一つ増分され、プロセスはステップS834へ戻り、ここで量子化画素値差分q(j)が行の次の画素に対して計算される。このプロセスは、jがステップS850でN−2以上となるまで、画素ブロックのその行全部について続く。これで、その行についての全テクスチャ値RTが計算されたことになる。
【0051】
列に沿ったテクスチャであるCTも、同じやり方で計算される。図10を参照して、ステップS862で、列テクスチャ値CTと行インデックスiがゼロに初期化される(列インデックスjは図8に示される呼出元ルーチンで設定されている)。ステップS864で画素ブロック列j中の隣接する画素値(行i+1とi)の間の画素値の差分dが計算される。
【0052】
次に画素値差分dが次のように量子化される。ステップS866で、dがeより大きい場合、次にステップS868で、量子化された画素値差分q(i)が+1に等しいと設定され、プロセスはステップS876へ進む。そうでない場合、プロセスはステップS870に続く。ステップS870で、画素値差分d(i)が−eより小さい場合は、次にステップS872で、量子化画素値差分q(i)が−1に等しいと設定され、プロセスはステップS876へ進む。ステップS870で、画素値差分d(i)が−eより小さくない場合は、次にステップS874で、量子化画素値差分q(i)は0に等しいと設定される。量子化された画素値差q(i)がステップS868、S872、またはS874で設定されてしまうと、プロセスはステップS876に移行する。
【0053】
ステップS876でi=0の場合、プロセスはステップS880へ進む。そうでない場合、ステップS878で、列テクスチャ値CTは、現在の量子化画素値差分q(i)とその前の量子化画素値差分q(i−1)との差の絶対値だけ増加される。次にプロセスはステップS880に続く。
【0054】
ステップS880でiがN−2を超えていない場合はiはステップS882で一つ増分され、プロセスはステップS864へ戻り、ここで量子化画素値差分q(i)が列の次の画素に対して計算される。このプロセスは、iがステップS880でN−2以上となるまで、画素ブロックの列全部について続く。これで、全テクスチャ値CTがその列について計算されたことになる。
【0055】
上に記載のRTとCTの関数は、それぞれ、行と列に沿った画素と画素との間の有意の変化を解析する。ある変化が有意であると認められるには、該変化が、ある閾値より大きく、かつ閾値処理された変化の直前の値とは異なる場合である。従って、一様な画素値、又は図12に示されるように画素値が一定割合で増大または減少する行または列は、テクスチャ値ゼロとなる。対照的に、図13に示されるように、交互にa,b,a,b,a,b,a,bと変化する画素値から構成される行または列は、|a−b|>eである限り、テクスチャ値最大となる。
【0056】
上に定義したテクスチャ関数の性質の一つは、eの値に極めて鋭敏なことである。従って、eの設定値は、特定のスキャナで測定できるバックグラウンドのページノイズより僅かに大きい値とする必要がある。典型的なe値は、画素が取り得る値が0〜255とした場合、6〜10の範囲である。
【0057】
さて、ブロックに対するテクスチャヒストグラムHistuvに基づいて煩雑さTuvを決定可能なアルゴリズムの一つを、図11を参照して説明する。この実施例では、ステップS890においてヒストグラム配列の最初の三つの値(これらは可能な行テクスチャの中で最も低い値に対応する)の和が求められる。ステップS892で、和が8未満であると、ステップS893で、Tuvは、ブロックがディテール画像部分として分類すべきと示すように設定される。しかし、和が8以上であると、ステップS894で第二の和が計算され、今度はヒストグラム配列の最初の二つの値だけの和が求められ、プロセスはステップS896へ進む。この第二の和がステップS896で9より大きいと、ステップS897で、Tuvは、画像ブロックがラインアート部分として分類すべきと示すように設定される。この第二の和がステップS896で9以下であると、ステップS899で、Tuvは、画像ブロックがピクトリアルとして分類すべきと示すように設定される。
【0058】
図15は、本発明の空間領域セグメント化を用いて修正量子化を行う装置を示す。コンピュータ1106には、メモリ1108、離散コサイン変換モジュール(DCTM)1110、セグメント化器1112、1個以上の量子化テーブル1114、修正量子化器1116、ハフマン符号テーブル1118、エンコーダ1120、およびメモリ1122が備えられる。
【0059】
スキャナ1104は、画像1102を走査し、これを8×8画素のブロックに分割する。デジタル化された走査データはコンピュータ1106のメモリ1108に伝送される。DCTM1110は該画素ブロックにDCT演算を行う。セグメント化器1112は、上に記載のように、空間領域セグメント化法を用い、メモリ1108に記憶された画素データに基づいて画素ブロックを分類する。
【0060】
ブロックがセグメント化器1112によって画像タイプに分類された後に、修正量子化器1116が、画像タイプに基づいて選択または修正された量子化テーブル1114を用いて、DCTM1110からのDCT結果の閾値処理および/または量子化を行う。量子化が修正量子化器1116によって行われた後に、コンピュータ内蔵のエンコーダ1120が、ハフマン符号テーブル1118を用いて、画素ブロックデータを符号化し、結果を出力したり、メモリ1122に記憶したりする。
【0061】
適応量子化に好ましいQ*テーブルを選択するために画素ブロックを画像タイプで分類することは、画素ブロックのDCT係数の関数に基づく周波数領域セグメント化を用いても行うことができる。例えば、画素ブロックの分類は、低い周波数および高い周波数のAC成分を示すDCT係数のそれぞれの大きさに基づいて行うことが可能である。本発明の態様においてこれを行う方法の一つを以下に記載する。
【0062】
周波数領域セグメント化法を用いるこの態様では、第一に、閾値振幅klowを超えるnlow個の最も低域の周波数のAC係数の数(Nlow)が決定され、それから閾値振幅khighを超えるnhigh個の最も高い周波数のAC係数の数(Nhigh )が決定される。第二に、該ブロックが、Nlow(低い周波数AC成分で、有意に大きい成分の数)とNhigh(高い周波数のAC成分で、有意に大きい成分の数)との関数として分類される。nlow、nhigh、klow、およびkhighに対する適切な値を選択することによって、該ブロックを、幾つかの可能な画像タイプ領域、例えばラインアートまたはディテールなど、の一つとしてタグ付けすることができる。
【0063】
[アルゴリズム1]
ステップ1.デコーダへ送るQテーブルを定義し、
ステップ2.各8×8画素ブロックに対して修正量子化を行い、
ステップ2a.画素ブロックに対してNlow(u,v)とNhigh(u,v)の計算を行い、
ステップ2b.Nlow(u,v)>clowかつNhigh(u,v)>chighならば、Tuv=TAG1と設定し、そうでないならば、
ステップ2c.Tuv=TAG2と設定し、
ステップ2d.QテーブルとTuvとの関数として8×8画素ブロックの修正量子化を行い、
ステップ2e.画素ブロックのエントロピー符号化を行い、そして
ステップ3.画像中のブロック全部が処理されるまでステップ2を繰り返す。
【0064】
上記のアルゴリズムは、画素ブロックを分類するのに用いることができる周波数領域セグメント化ルールの可能な一つを示す。この態様では、ラインアートタイプとディテールタイプとについてのみの、画像ブロックの分類が行われる。TAG1とTAG2とは、0から1までのファジー数で、ブロックの煩雑さの程度を表す。uは該ブロックを含む画像の行のインデックスで、vは該ブロックを含む画像列のインデックスである。clow、chigh、TAG1、TAG2の値は、最良の結果を得るように経験的に選択することができる。以下の値は、このアルゴリズムを用いて成功した例に用いられたものである。klow=31;khigh=32;nlow=32;nhigh=8;clow=5;chigh=20;TAG1=ラインアート;TAG2=ディテール。
【0065】
以下のアルゴリズムは、この方法の別の態様の一つを示すもので、各画素ブロックについて最大4個までの異なる画像タイプを識別する方法である。clow1、chigh1、clow2、chigh2、TAG1、TAG2、TAG3、およびTAG4の値は、最良の結果を得るように経験的に選択することができる。
【0066】
[アルゴリズム2]
ステップ1.デコーダへ送るQテーブルを定義し、
ステップ2.各8×8画素ブロックに対して修正量子化を行い、
ステップ2a.画素ブロックに対してNlow(u,v)とNhigh(u,v)の計算を行い、
ステップ2b.Nlow(u,v)>clow1かつNhigh(u,v)>chigh1ならば、Tuv=TAG1と設定し、そうでない場合、
ステップ2c.Nlow(u,v)>clow2かつNhigh(u,v)>chigh2ならば、Tuv=TAG2と設定し、そうでない場合、
ステップ2d.Nlow(u,v)>clow1かつNhigh(u,v)>chigh2ならば、Tuv=TAG3と設定し、そうでないならば、
ステップ2e.Tuv=TAG4と設定し、
ステップ2f.QテーブルとTuvとの関数として8×8画素ブロックの修正量子化を行い、
ステップ2g.画素ブロックのエントロピー符号化を行い、そして
ステップ3.画像中のブロック全部が処理されるまでステップ2を繰り返す。
【0067】
上記のアルゴリズムは、最大4個までだけの異なる画像タイプを認識するにすぎないが、他の態様では同様の方法を用いて、より細かく画像タイプを区別することができる。例えば、上記の二番目のアルゴリズムで、{Nlow(u,v)>clow2かつNhigh(u,v)>chigh1}という場合に対しもう一つ別のタグ(TAG)を定義することができる。他の態様では、別の値のclowとchighとを追加して定義することによって、更に別の画像タイプを識別することもできる。j個の異なるclow値とk個の異なるchigh値とがあれば、このやり方で最大でj・k+1個の画像タイプの段階を識別できる。
【0068】
この周波数領域セグメント化法を、上記のアルゴリズムを示している図16と図17とを参照して説明する。ステップS1202で、JPEGデコーダへ伝送されるQテーブルが定義される。ステップS1204で、「低い周波数」と考えられる最も低い周波数のAC成分の数(nlow)が定義される。ステップS1206で、「高い周波数」と考えられる最も高いAC成分の数(nhigh)が定義される。ステップS1208で、AC成分の低振幅の閾値(klow)とAC成分の高振幅の閾値(khigh)とが定義される。ステップS1209で、低い周波数の閾値および高い周波数の閾値であるclow1、chigh1、clow2、chigh2が定義される。
【0069】
次に、プロセスは継続して、ブロック毎に画像タイプ(TAG)が決定される。ステップS1210で,nlow個の最も低い周波数のAC成分で、振幅がklowより大きいものの数(Nlow)が決定される。ステップS1212で,nhigh個の最も高い周波数のAC成分で、振幅がkhighより大きいものの数(Nhigh)が決定される。
【0070】
NlowがステップS1214でclow1より大きい場合は、NhighがステップS1216でchigh1と比較される。NhighがステップS1216でchigh1より大きい場合は、TuvはステップS1218でTAG1と設定され、プロセスはステップ1232に続く。NlowがステップS1214でclow1より大きいと判ったが、NhighがステップS1216でchigh1より大きくないと判った場合は、Nh ighはステップS1220でchigh2と比較される。NhighがステップS1220でchigh2より大きいと判定された場合は、TuvはステップS1222でTAG3と設定され、プロセスはステップ1232に続く。
【0071】
一方、NlowがステップS1214でclow1より大きくないと判った場合、あるいはステップS1220でchigh2より大きくないと判った場合は、プロセスはステップS1224へ続く。NlowがステップS1224でclow2より大きい場合はNhighがステップS1226でchigh2と比較される。NhighがステップS1226でchigh2より大きいと判定された場合は、TuvはステップS1228でTAG2と等しいと設定される。一方、NlowがステップS1224でclow2より大きくないと判った場合、あるいはNhighがステップS1226でchigh2より大きくないと判った場合は、TuvはステップS1230でTAG4と設定される。
【0072】
Tuvに対する値がステップS1218、S1222、S1228、またはS1230で設定されてしまうと、プロセスはステップS1232に継続する。プロセスが、ステップS1232で画像の全てのブロックに対してまだ行われなかった場合は、プロセスはステップS1210へ戻り、ここで上記のセグメント化手順が繰り返され、画像の次のブロックに対して正しいTuvを求める。プロセスが、ステップS1232で画像の全てのブロックに対して行われたと判定された場合は、プロセスは終了である。
【0073】
図18は、本発明の空間領域セグメント化を用いて修正量子化を行う装置を示す。コンピュータ1306には、メモリ1308、離散コサイン変換モジュール(DCTM)1310、セグメント化器1312、1以上の量子化テーブル1314、修正量子化器1316、ハフマン符号テーブル1318、エンコーダ1320、およびメモリ1322が備えられる。
【0074】
スキャナ1304は、画像1302を走査し、これを8×8画素ブロックに分割する。デジタル化された走査データはコンピュータ1306のメモリ1308に伝送される。DCTM1310は該画素ブロックにDCTを行う。セグメント化器1312は、上に記載のように、DCTM1310によって計算されたDCT係数に基づく周波数領域セグメント化を用いて、画素ブロックを分類する。
【0075】
ブロックが画像タイプに分類された後では、修正量子化器1316が、上に記載のように、セグメント化器1312からの結果に基づいて選択または修正された量子化テーブル1314を用いて、DCTM1310から得られるDCT係数の閾値処理および/または量子化を行う。量子化が修正量子化器1316によって行われた後では、コンピュータ内蔵のエンコーダ1320が、ハフマン符号テーブル1318を用いて、画素ブロックデータを符号化し、結果を出力したり、メモリ1322に記憶したりする。
【0076】
もう一度図4と図5を参照する。画素ブロックが画像タイプで分類された後では、そのブロックの画像タイプの分類に従って、そのブロックの量子化が最良になるように、修正量子化408Fが行われる。態様の一つでは、タグが、セグメント化関数406Fによって作成され、これによりDCT係数が量子化される。次いで、図5を参照すると、上記のように8×8画素ブロックに行われたDCT演算から得られるDCT係数が、Q*テーブルを用いて閾値処理される。このQ*テーブルは、画素ブロックに対して決定された画像タイプに依存して変わる。
【0077】
適切な量子化修正テーブルは、Tuvに応じてルックアップテーブルから検索することができるし、あるいは量子化修正テーブルは、Tuvと、デコーダへ伝送されるQテーブル406の係数との関数から作成することができる。例えば、Tuv=0.9がディテール領域を示すとすれば、テキストについて最適化されたQテーブル406の値を、上記関数によって非線形的に調整して、Q*テーブル506の値を得るようにできる。このやり方で、セグメント化タグTuvの関数として元のテーブルから新しいQ*テーブルを作成することができる。
【0078】
適切なQ*テーブルを選択もしくは作成した後で、DCT係数104をその修正量子化テーブルに基づいて閾値処理する。これは、ブロックの画像品質に寄与しない係数をゼロにしてしまう効果がある。強度の小さな係数は、粗い量子化が望ましい時にはゼロにされ、より精細な量子化Qテーブルだけがデコーダへ伝送される。Q*テーブルは、セグメント化タグがラインアートタイプ(例えば、テキストタイプ)領域を示す場合には、元のQテーブルと全く同一であることに留意されたい。
【0079】
修正DCT係数507を得た後では、これら係数を元のQテーブル406によって量子化し、各S* xyを対応するQxyで割り、その結果を最も近い整数に丸めることによって、量子化DCT係数(Sq* 00,Sq* 01,.....,Sq* xy,......,Sq* 77)508を得る。以下のアルゴリズムはこのプロセスを示す。
【0080】
[アルゴリズム3]
Q* xyを、QxyとTuvとの関数として定義し(ここでTuv=セグメント化タグ)、
DCT係数Sxyを、Sxy<Q* xyならばS* xy=0、そうでなければS* xy=Sxy、と閾値処理し、そして
S* xyを、Qテーブルを用いて量子化し、
Sq* xy=Round(S* xy/Qxy)とする(Roundは丸め処理を表す)。
【0081】
本発明の別の方法の態様では、Q*テーブル506を閾値処理に用いるのではなく、デコーダに送られるQテーブル406の代わりに、DCT係数104の量子化にQ*テーブル506を直接用いる。次に、得られた量子化係数Sq* xy各個に、Q*テーブルの係数Q* xyを対応するQテーブルの係数Qxyで割って得られるスケーリングファクターを乗じる。以下のアルゴリズムは、この方法のプロセスを示す。
【0082】
[アルゴリズム4]
Q* xyを、Tuvとの関数として定義し(ここでTuv=セグメント化タグであり、Q* xy ≧Qxyとなるようにする)、そして
S* xyを、Q*テーブルを用いて量子化し、Qテーブルに基づいてスケーリングし、
Sq* xy=Round{Q* xyRound(Sxy/Q* xy)/Qxy}とする。
【0083】
上記の量子化修正アルゴリズムの修正量子化処理を用いて圧縮を行う例を、図19〜21、図22〜26、図27〜31、および図32〜36を参照して以下に説明する。図19は、テキストに最適化されたQテーブルで、これがJPEGデコーダへ送られる。図20に示すのは、ピクトリアルタイプの画像に適用された場合に、図19のQテーブルよりも高い圧縮率を実現し、再生されたJPEG画像に人間の目に認識できる望ましくないアーティファクトが過度に形成されないようにできる量子化テーブルである。同様に、図21に示すのは、ディテールタイプ画像領域(例えば、ハーフトーン)では、より一層高い圧縮率をもたらし、人間の目に認識できる望ましくないアーティファクトが過度に形成されないような量子化テーブルである。以下の例は、いかにしてディテール画像、ピクトリアル画像、およびテキスト画像が、それぞれ量子化され、JPEG符号化されるかを示す。
【0084】
図22は、ディテールタイプと分類された8×8ハーフトーン画素ブロックの生データのサンプルを示す。この画素ブロックにDCT演算を行うと、図23に示されるDCT係数が、ブロックオーダーフォーマットで得られる。これは図2および図5のSxy係数104に対応する。図24は、ディテールタイプと分類された画素ブロックに対して最適化されたQ*テーブルのサンプルを示す(図21の値と同じ)。このQ*テーブルの係数は、図5のQ* xy係数506に対応する。
【0085】
図5と図25に示される閾値処理されたDCT係数のテーブル507は、この態様では閾値処理関数407Fにより、図23のDCT係数Sxyの大きさが図24の閾値処理用Q*テーブル中の対応する閾値Q* xy未満の場合に、それらSxyをゼロに設定することによって作成される。例えば、図23,24,および25を参照すると、閾値処理されたDCT係数S* 30は、−35である。なぜなら、閾値処理用Q*テーブル中の係数Q* 30=33が、対応するDCTデータ係数の大きさすなわち|S30|=35より大きくないからである。しかし、閾値処理されたDCT係数S* 32は、ゼロである。なぜなら、閾値処理用Q*テーブル中の係数Q* 32=105が、対応するDCTデータ係数の大きさ|S32|=94より大きいからである。
【0086】
量子化処理108Fが、図5と19に示されるテキスト最適化Qテーブル406を用いて、閾値処理されたDCTテーブル507に対して行われ、この結果図5と図26に示される量子化されたDCT係数508が得られる。量子化されたDCT係数Sq* 10は、−8である。なぜなら、S* 10/Q10=Round (−81/10)=−8だからである。その結果、JPEG圧縮画像の復号において、復号により得られる係数は−8×10=−80である。この態様では、画像タイプに鋭敏な閾値処理用Q*テーブル506が閾値処理に用いられるが、復号に用いられるテキスト最適化Qテーブル406も、閾値処理された値を量子化するのに用いられる。
【0087】
図27〜31は、本発明の同じ態様を、図27に示されるピクトリアルタイプの画素ブロックに適用するサンプルを示す。この画素ブロックにDCT演算を行うと、図28に示されるDCT係数が得られる。この場合、ピクトリアルとして分類される画素ブロックに対する閾値処理用Q*テーブル506であって、図5,20,および29に示されるテーブルが、図28のDCTテーブルに適用され、図5と30に示される、閾値処理されたDCT係数のテーブル507が得られる。この場合、得られた閾値処理後のDCT係数S* 70はゼロである。なぜならQ* 70=59が|S70|=21より大きいからである。一方、図19のテキスト最適化Qテーブルを用いた場合は、閾値処理されたDCT係数S* 70は、−21になったはずである。なぜなら、図19でのQ70=16は|S70|=21より大きくないからである。
【0088】
最後に、得られた閾値処理後のDCT係数S*が、図5と図19に示されるテキスト最適化Qテーブル406を用いて、量子化され、図5と図31に示される量子化されたDCT係数508が得られる。この場合も、画像タイプに鋭敏な閾値処理用Q*テーブル506が閾値処理に用いられるが、復号に用いられるテキスト最適化Qテーブル406も、閾値処理された値を量子化するのに用いられる。
【0089】
最後に、図32〜36は、本発明のこの態様が、図32に示されるテキストタイプの画素ブロックにどのように適用されるかを示す。この画素ブロックにDCT演算を行うと、図33に示されるDCT係数が得られる。本発明の態様の一つでは、処理は前と同じように進めることができる。すなわち、図1,5, および33に示されるDCT係数104を、テキスト用に最適化されたQ*テーブル506を用いて、閾値処理することができる。該テーブルはこの場合、図19に示されるQテーブルと同一である。この処理により、図5と図34に示される閾値処理後のDCT係数507が得られる。閾値処理されたDCT係数S*を、テキスト最適化Qテーブル406を用いて量子化すると、図5と図35に示される、量子化されたDCT係数508が得られる。
【0090】
ただし、図19に示されるQテーブル406は既にテキスト用に最適化されているので、量子化の前にテキストタイプDCT係数を閾値処理することは不必要であり、不利ですらあるとも考えられる。なぜなら画質に悪影響を与える恐れがあるからである。従って、最も精細な量子化値を要する画像タイプ(この場合、テキスト)を処理している時は、図2に示されるような閾値処理ステップは行わないで済ませてもよい。この場合、図19のテキスト最適化Qテーブル106、406を、図33の閾値処理されていないテキストDCT係数104を直接量子化するのに使えば、結果は、図36の量子化DCT係数108となる。
【0091】
このように、この態様では、認知品質を過度に劣化させないで一層の圧縮化を行うことができる画像タイプの画素ブロックは、量子化の前に閾値処理が行われる。しかし、最も高精細な量子化値を要する画像タイプの画素ブロックは、閾値処理を行わないで量子化されるので、これら特定のブロックに対しては、処理は図1〜3に示される処理と同じである。
【0092】
上記の本発明の態様の一つが、図37に記載される。ステップS1800で、すでにセグメント化が行われ、所与の画素ブロックに対する画像タイプタグTuvが既に決定されているものとする。ステップS1802で、修正量子化モジュール408Fは、Tuvの示すのが、最高品質の処理を必要とする画像タイプ(例えば、テキストが可能な画像タイプの中に含まれる場合は、テキスト)であるかどうかをチェックする。そうならば、プロセスはステップS1808へ進む。
【0093】
Tuvの示すのが、一層の圧縮を行うことができる画像タイプ(例えば、ピクトリアルまたはディテール)ならば、その画像タイプに対する適切な量子化修正テーブル( Q*テーブル)がステップS1804で選択される。ステップS1806で、画素ブロックのDCT係数が、選択されたQ*テーブルを用いて閾値処理され、プロセスはステップS1808に続く。ステップS1808では、得られたDCT係数が、閾値処理の有無を問わず、最高品質の(例えば、テキストに最適化された)テーブルを用いて量子化され、デコーダへ伝送される。
【0094】
表2に示すのは、上記の方法を400〜600dpiの幾つかの画像に適用したものである。比較のために、同一の量子化テーブル(Qテーブル)をエンコーダとデコーダとに用い、同様の解像度の画像のJPEGおよびQSEG圧縮/伸張を行った。解像度が異なる画像は、異なるQテーブルを用いて圧縮し、伸張した。なお、「QSEG」とは、本実施形態で行われる圧縮を称する。
【0095】
【表2】
上の表2から判るように、本発明による量子化修正法では、一般に圧縮率が格段に改良される。本方法の別の利点は、本実施形態の適応JPEG量子化法のQ*テーブルが連続的に修正できるということである。各ブロックが異なる圧縮技術間で選択する有限のタグセットを作成する(これも取りうるオプションの一つではある)代わりに、本方法では、元のQテーブルから新しいQ*テーブルを各画素ブロックに対して個別に作成できる連続関数が提供される。
【0096】
以上を総括すれば、本発明によって、デコーダへ新しい情報を更に伝送することなく圧縮率を改善できる適応量子化が達成される。本実施形態の量子化修正処理を用いれば、画像が画素ブロックにセグメント化され、各画素ブロックの画像タイプが個別に決定される。各画像ブロックのDCT係数は、量子化の前に修正することもできるし、あるいは決定された画像ブロックタイプに基づき、量子化修正テーブルを用いて量子化することもできる。こうすると、同じ量子化テーブルを用いて画像のブロック全てのDCT係数を直接量子化することによって得られた圧縮率よりも高い圧縮率を有するデータが(後続のエントロピー符号化の後)得られる。
【0097】
得られた圧縮データは、それでも、デコーダへ送られる(画像プレーン当たり)1個の量子化テーブルを用いて、標準JPEGベースラインデコーダで復号できる。量子化テーブルやDCT係数を圧縮の前にどのように修正したかに関する情報は、一切デコーダへ送る必要はない。従って、既存のJPEGデコーダは、多数の量子化テーブルをサポート不可能なベースラインシーケンシャルJPEGデコーダをも含めて、本発明に従って符号化された圧縮データを正確に伸張するのに用いることができる。
【0098】
本発明に関し、上述のごとく具体的な態様を説明したが、当業者ならばこれに対して多くの別法や修正や変形ができることは明らかである。例えば、本発明はJPEGシーケンシャルモードに準拠しているけれども、JPEGプログレッシブ符号化にも適用できる。更に例を挙げれば、本発明は、図15と18に示されるような、プログラムされた汎用コンピュータに組み入れることができる。しかし、本発明は、特定用途用のコンピュータ、プログラムされたマイクロプロセッサまたはマイクロコントローラおよび周辺IC部品、ASICまたは他のIC、プログラマブルロジック装置、例えば、PLD、PLA、FPGAまたはPALなどに組み入れることができる。一般には、図8〜11、16、17、および37に示されるフローチャートを組み入れることが可能な装置はどんなものでも本発明を用いることが可能である。
【0099】
以上、本明細書に記載の発明の態様は、説明の目的でなされたものであり、限定的に解釈されるべきではない。特許請求の範囲に規定された本発明の範囲から逸脱せずに、多様な変形を行うことが可能である。
【図面の簡単な説明】
【図1】 JPEG準拠の技術を表す機能ブロック図である。
【図2】 JPEG準拠の符号化に対する量子化プロセスを示す図である。
【図3】 JPEG圧縮技術のフローチャートである。
【図4】 本発明の態様の一つのセグメント化および適応量子化技術を表す機能ブロック図である。
【図5】 本発明の態様の一つの量子化プロセスを示す図である。
【図6】 本発明の態様の一つのN×N画素ブロックに対するテクスチャ配列を示す図である。
【図7】 本発明の態様の一つの適応量子化に用いられる量子化関数を示す図である。
【図8】 本発明の態様の一つに従って全画素ブロックテクスチャと画素ブロックテクスチャヒストグラムを計算するプロセスを示す図である。
【図9】 図8のプロセスに用いられる行テクスチャ計算アルゴリズムを示す図である。
【図10】 図8のプロセスに用いられる列テクスチャ計算アルゴリズムを示す図である。
【図11】 画素ブロックテクスチャヒストグラムから画像タイプタグを得るアルゴリズムを示す図である。
【図12】 画素値が単調増大する行がゼロテクスチャとなることを説明するための図である。
【図13】 a,bと交互に変化するパターンが最大値テクスチャとなることを説明するための図である。
【図14】 異なるテクスチャの8×8ブロックにおける典型的テクスチャヒストグラムを示す図である。
【図15】 本発明の態様の一つの空間領域セグメント化を用いて修正量子化を行う装置を示す図である。
【図16】 本発明の態様の一つである周波数領域セグメント化処理の一態様のアルゴリズムを示す図である。
【図17】 本発明の態様の一つである周波数領域セグメント化処理の一態様のアルゴリズムを示す図である。
【図18】 本発明の態様の一つの周波数領域セグメント化を用いて修正量子化を行う装置を示す図である。
【図19】 本発明の態様の一つにおいてJPEGデコーダへ送られるテキスト最適量子化テーブルを示す図である。
【図20】 本発明の態様の一つにおいて用いられるピクトリアルタイプ画像ブロック用量子化テーブルを示す図である。
【図21】 本発明の態様の一つにおいて用いられるディテールタイプ画像ブロック用量子化テーブルを示す図である。
【図22】 ある画像のディテールタイプの8×8画素ブロックの例を示す図である。
【図23】 図22の画素ブロックから求められたDCT係数を示す図である。
【図24】 図21の量子化テーブルを、本発明の一態様においてディテールタイプ画像ブロックに対する量子化修正テーブルとして用いた場合を示す図である。
【図25】 図21の量子化テーブルを、図23のDCT係数を閾値処理するのに用いた時に得られるDCT係数を示す図である。
【図26】 図19の量子化テーブルを、図25の閾値処理されたDCT係数を量子化するのに用いた時に得られる量子化DCT係数を示す図である。
【図27】 ある画像におけるピクトリアルタイプの8×8画素ブロックの例を示す図である。
【図28】 図27の画素ブロックから求められたDCT係数を示す図である。
【図29】 ピクトリアルタイプ画像ブロックに対して本発明の一態様において量子化修正テーブルとして用いる図20の量子化テーブルを示す図である。
【図30】 図20の量子化テーブルを、図28のDCT係数を閾値処理するのに用いた時に得られる閾値処理されたDCT係数を示す図である。
【図31】 図19の量子化テーブルを、図30の閾値処理されたDCT係数を量子化するのに用いた時に得られる量子化DCT係数を示す図である。
【図32】 ある画像におけるテキストタイプの8×8画素の例を示す図である。
【図33】 図32の画素ブロックから求められたDCT係数を示す図である。
【図34】 図19の量子化テーブルを、図33のDCT係数を閾値処理するのに用いた時に得られる閾値処理されたDCT係数を示す図である。
【図35】 図19の量子化テーブルを、図34の閾値処理されたDCT係数を量子化するのに用いた時に得られる量子化DCT係数を示す図である。
【図36】 図19の量子化テーブルを、図33の閾値処理されていないDCT係数を量子化するのに用いた時に得られる量子化DCT係数を示す図である。
【図37】 本発明の態様の一つであるJPEG準拠の修正量子化技術を表すフローチャートである。
【符号の説明】
102 8×8画素ブロック、104 DCT(離散コサイン変換)係数、104F DCT処理、106,406 量子化テーブル、108 量子化DCT係数、108F 量子化処理、110 エントロピーエンコーダ、112,1118 ハフマン符号テーブル、114 圧縮データ、406F セグメント化処理、407F 閾値処理、408F 修正量子化処理、506 修正量子化テーブル、1102,1302 画像、1104,1304 スキャナ、1108,1122,1308,1322 メモリ、1110,1310 離散コサイン変換モジュール、1112,1312 セグメント化器、1114、1314 量子化テーブル、1116,1316 修正量子化器、1120,1320 エンコーダ。
Claims (13)
- 画像を表すデータを符号化して、デコーダが画像を再生できる出力データを作成する方法であって、
前記画像の少なくとも1つのプレーンの画像信号データであって、各々が複数の画素行及び画素列についてのデータを有する第一画素ブロックと第二画素ブロックとを含む画像信号データを入力するステップと、
第一画素ブロックに変換を行って第一係数を求めるステップと、
第一画素ブロックの解析に基づいて第一画像タイプを求めるステップと、
前記第一画像タイプの画像を表す係数を量子化するのに最適化された第一修正テーブルを求めるステップと、
前記第一画像タイプとは異なる基本画像タイプに変換を行うことによって得られる基本画像係数を量子化するのに最適化された精細量子化テーブルであって、前記第一修正テーブルとは異なる精細量子化テーブルを求めるステップと、
前記第一修正テーブルと前記精細量子化テーブルとの双方に基づいて前記第一係数を修正することによって第一修正係数を求めるステップと、
前記デコーダが前記画像を再生できる出力データであって、前記第一修正係数と前記精細量子化テーブルに関する情報とを示すデータを含むが、前記第一修正テーブルの情報は含まない出力データを生成するステップと、
を含むことを特徴とする方法。 - 前記第一修正係数を得るステップが、
前記第一修正テーブルに基づいて第一係数を閾値処理して、第一閾値処理係数を得るステップと、
前記精細量子化テーブルに基づいて前記第一閾値処理係数を量子化するステップと、
を含むことを特徴とする請求項1記載の方法。 - 前記変換が、離散コサイン変換であることを特徴とする請求項1又は請求項2記載の方法。
- 前記精細量子化テーブルが、テキスト画像用に最適化された量子化テーブルであり、前記デコーダがJPEG準拠デコーダであることを特徴とする請求項1又は請求項2記載の方法。
- 前記第二画素ブロックに変換を行って、第一係数とは異なる第二係数を求めるステップと、
前記第二画素ブロックの解析に基づいて第一画像タイプ及び基本画像タイプのいずれとも異なる第二画像タイプを求めるステップと、
前記第二画像タイプの画像を表す係数を量子化するのに最適化された第二修正テーブルであって、前記第一修正テーブル及び前記精細量子化テーブルのいずれとも異なる第二修正テーブルを求めるステップと、
前記第二修正テーブルと前記精細量子化テーブルとの双方に基づいて前記第二係数を修正することによって第二修正係数を得るステップと、
を更に含み、前記出力データが、前記第二修正係数を示すデータを更に含むが、前記第二修正テーブルについて記載する情報は含まないことを特徴とする請求項1記載の方法。 - 前記第一修正係数を求めるステップが、前記第一修正テーブルに基づいて第一係数を閾値処理することにより第一閾値処理係数を得るステップと、前記精細量子化テーブルに基づいて前記第一閾値処理係数を量子化するステップと、を含み、
前記第二修正係数を求めるステップが、前記第二修正テーブルに基づいて第二係数を閾値処理することにより第二閾値処理係数を求めるステップと、前記精細量子化テーブルに基づいて前記第二閾値処理係数を量子化するステップと、含む、請求項5記載の方法。 - 前記第一画素ブロックの解析に基づいて第一画像タイプを求めるステップが、複数の画素行及び画素列についてのデータに対する空間領域解析によってそれら画素行と画素列とについてのテクスチャ値を得るステップを含むことを特徴とする請求項1記載の方法。
- 前記第一画素ブロックの解析に基づいて第一画像タイプを求めるステップが、
複数の画素行及び画素列についてのデータに対する空間領域解析によってそれら画素行及び画素列とについてのテクスチャ値を得るステップと、
ヒストグラム値を計算することにより、それら画素行及び画素列について得られた前記テクスチャ値の数値的な分布を求めるステップと、
前記テクスチャ値の分布に基づいて第一画像タイプを決定するステップと、
を含むことを特徴とする請求項1記載の方法。 - 画像を表す入力データ信号を符号化する装置であって、
前記画像の1プレーンのブロック状領域を示すデータを受け取り、これらデータに変換を行うことにより、前記領域を表すデータに対応する変換係数を得る変換モジュールと、
(1)前記変換モジュールによって得られた変換係数及び(2)前記領域を表すデータの空間領域解析のいずれか一方に基づいて、前記ブロック状領域を第一画像タイプであると特徴付けるセグメント化器と、
変換モジュールから変換係数を受け取り、(1)第一画像タイプを量子化するのに最適化された第一量子化テーブル及び(2)第一画像タイプとは異なる基本画像タイプを量子化するのに最適化された精細量子化テーブルの両方に基づいて前記変換係数を修正することによって修正係数を得る修正量子化器と、
量子化された係数を、前記精細量子化テーブルを表すが前記第一量子化テーブルは表さない情報と共に出力する出力モジュールと、
を備える装置。 - 前記セグメント化器が、前記領域を表すデータの空間領域解析に基づいて前記領域の画像タイプを特徴付ける請求項9記載の装置。
- 前記修正量子化器が、
前記変換モジュールから変換係数を受け取り、前記第一量子化テーブルに基づいて前記変換係数を閾値処理することによって、閾値処理係数を得る閾値処理器と、
この閾値処理器から閾値処理係数を受け取り、前記精細量子化テーブルに基づいて前記閾値処理係数を量子化することによって、量子化係数を生成する量子化モジュールと、
を備えることを特徴とする請求項9記載の装置。 - 前記セグメント化器が、前記領域を表すデータの空間領域解析に基づいて前記領域の画像タイプを特徴付ける請求項11記載の装置。
- 前記精細量子化テーブルが、テキスト画像を量子化するのに最適化されていることを特徴とする請求項11又は請求項12記載の装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/013,485 | 1998-01-26 | ||
US09/013,485 US6252994B1 (en) | 1998-01-26 | 1998-01-26 | Adaptive quantization compatible with the JPEG baseline sequential mode |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11317944A JPH11317944A (ja) | 1999-11-16 |
JP4303818B2 true JP4303818B2 (ja) | 2009-07-29 |
Family
ID=21760201
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP01616999A Expired - Fee Related JP4303818B2 (ja) | 1998-01-26 | 1999-01-25 | 画像符号化方法及び装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US6252994B1 (ja) |
EP (1) | EP0933947B1 (ja) |
JP (1) | JP4303818B2 (ja) |
Families Citing this family (47)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6351442B1 (en) | 1998-06-03 | 2002-02-26 | Matsushita Electric Industrial Co., Ltd. | Recording medium, recording apparatus and reproduction apparatus with reproduction path flag information |
US6625323B2 (en) * | 1998-09-25 | 2003-09-23 | Eastman Kodak Company | Method for compressing and decompressing digital having text |
US6771393B1 (en) * | 1999-08-09 | 2004-08-03 | Conexant Systems, Inc. | Transmission rate control for continuous-tone facsimile |
US7050639B1 (en) * | 1999-11-24 | 2006-05-23 | General Electric Company | Image data compression employing multiple compression code tables |
DE10050951A1 (de) * | 2000-10-13 | 2002-05-02 | Image D C Gmbh Interfunctional | Verfahren zur Erfassung, Organisation, Verarbeitung, Übertragung und Archivierung von ein- und mehrdimensionalen, digitalen Daten insbesondere stehender und bewegter Bilddaten |
WO2002080573A1 (en) * | 2001-03-28 | 2002-10-10 | Sony Corporation | Quantization apparatus, quantization method, quantization program, and recording medium |
US6853755B2 (en) * | 2001-03-28 | 2005-02-08 | Sharp Laboratories Of America, Inc. | Method and apparatus for adaptive compression of scanned documents |
US6915019B2 (en) * | 2001-03-30 | 2005-07-05 | Sharp Laboratories Of America, Inc. | Method for combining vector-quantization decoding with color transform or halftoning or both |
US6650784B2 (en) * | 2001-07-02 | 2003-11-18 | Qualcomm, Incorporated | Lossless intraframe encoding using Golomb-Rice |
US7092578B2 (en) * | 2001-10-23 | 2006-08-15 | Agilent Technologies, Inc. | Signaling adaptive-quantization matrices in JPEG using end-of-block codes |
US7053953B2 (en) * | 2001-12-21 | 2006-05-30 | Eastman Kodak Company | Method and camera system for blurring portions of a verification image to show out of focus areas in a captured archival image |
US7397858B2 (en) * | 2002-05-29 | 2008-07-08 | Innovation Management Sciences, Llc | Maintaining a plurality of codebooks related to a video signal |
AU2004218686B2 (en) * | 2003-10-10 | 2006-08-31 | Canon Kabushiki Kaisha | A Combined Spatial and Transform Domain Method for Compressing Image Data into a Fixed Size Buffer |
US7302107B2 (en) * | 2003-12-23 | 2007-11-27 | Lexmark International, Inc. | JPEG encoding for document images using pixel classification |
GB2427784A (en) * | 2003-12-23 | 2007-01-03 | Lexmark Int Inc | JPEG Encoding For Document Images Using Pixel Classification |
US20050141774A1 (en) * | 2003-12-30 | 2005-06-30 | Eastman Kodak Company | Image compression utilizing discarding of bitplanes |
US6853318B1 (en) | 2003-12-30 | 2005-02-08 | Eastman Kodak Company | Digital image compression utilizing shrinkage of subband coefficients |
JP3954032B2 (ja) * | 2004-01-09 | 2007-08-08 | シャープ株式会社 | 画像符号化装置、画像符号化方法、画像符号化プログラムおよび画像符号化プログラムを記録したコンピュータ読取可能な記録媒体 |
US7424151B2 (en) * | 2004-06-04 | 2008-09-09 | Xerox Corporation | Method and system for image classification and halftone frequency detection |
US7469067B2 (en) * | 2004-07-06 | 2008-12-23 | Magnum Semiconductor, Inc. | Sequential decoding of progressive coded JPEGs |
CN101002478A (zh) * | 2004-08-13 | 2007-07-18 | 皇家飞利浦电子股份有限公司 | 用于混合的图形和视频序列的自适应分类系统和方法 |
US7574055B2 (en) * | 2004-09-07 | 2009-08-11 | Lexmark International, Inc. | Encoding documents using pixel classification-based preprocessing and JPEG encoding |
US7444030B2 (en) * | 2004-11-12 | 2008-10-28 | Micron Technology, Inc. | Image encoding with dynamic buffer-capacity-level-based compression adjustment |
US8630498B2 (en) * | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
US8437054B2 (en) * | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
US7864365B2 (en) * | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
US7876959B2 (en) * | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
WO2010005360A1 (en) * | 2008-07-08 | 2010-01-14 | Scalado Ab | Method for compressing images and a format for compressed images |
FR2940577B1 (fr) * | 2008-12-23 | 2011-04-22 | Sagem Comm | Procede d'encodage par segmentation d'une image. |
US9110849B2 (en) | 2009-04-15 | 2015-08-18 | Qualcomm Incorporated | Computing even-sized discrete cosine transforms |
US9069713B2 (en) * | 2009-06-05 | 2015-06-30 | Qualcomm Incorporated | 4X4 transform for media coding |
US9118898B2 (en) * | 2009-06-24 | 2015-08-25 | Qualcomm Incorporated | 8-point transform for media data coding |
US9081733B2 (en) | 2009-06-24 | 2015-07-14 | Qualcomm Incorporated | 16-point transform for media data coding |
US9075757B2 (en) * | 2009-06-24 | 2015-07-07 | Qualcomm Incorporated | 16-point transform for media data coding |
EP2486517A4 (en) * | 2009-10-05 | 2014-06-11 | Icvt Ltd | APPARATUS AND METHODS FOR RECOMPRINTING DIGITAL IMAGES |
US20110199633A1 (en) * | 2010-02-17 | 2011-08-18 | Nguyen Uoc H | Halftone bit depth dependent digital image compression |
EP2564354A4 (en) | 2010-04-29 | 2014-03-12 | Icvt Ltd | APPARATUS AND METHODS FOR RECOMPRESSION HAVING A MONOTONE RELATIONSHIP BETWEEN COMPRESSION LEVEL AND COMPRESSED IMAGE QUALITY |
EP2616991A4 (en) | 2010-09-17 | 2014-03-12 | Icvt Ltd | REDUCING A CODED IMAGE |
US9014471B2 (en) | 2010-09-17 | 2015-04-21 | I.C.V.T. Ltd. | Method of classifying a chroma downsampling error |
US9824066B2 (en) * | 2011-01-10 | 2017-11-21 | Qualcomm Incorporated | 32-point transform for media data coding |
JP2012205181A (ja) * | 2011-03-28 | 2012-10-22 | Fuji Xerox Co Ltd | 画像処理装置およびプログラム |
PL3573337T3 (pl) * | 2011-04-22 | 2022-09-26 | Dolby International Ab | Sposób i urządzenie do kodowania z kompresją stratną danych obrazu |
CN102611823B (zh) * | 2012-01-13 | 2014-06-04 | 百度在线网络技术(北京)有限公司 | 一种基于图片内容选择压缩算法的方法和设备 |
CN102724381B (zh) * | 2012-06-15 | 2014-04-02 | 杭州电子科技大学 | 基于jpeg压缩原理的票据类图像压缩方法 |
US9020291B2 (en) * | 2012-08-31 | 2015-04-28 | Hewlett-Packard Development Company, L.P. | Resized image compression based on frequency content |
CN107333135B (zh) * | 2017-06-05 | 2020-07-10 | 贵阳朗玛信息技术股份有限公司 | 影像图片的呈现方法及装置 |
CN110363776B (zh) * | 2019-06-28 | 2021-10-22 | 联想(北京)有限公司 | 图像处理方法及电子设备 |
Family Cites Families (27)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5309526A (en) | 1989-05-04 | 1994-05-03 | At&T Bell Laboratories | Image processing system |
CA2014935C (en) | 1989-05-04 | 1996-02-06 | James D. Johnston | Perceptually-adapted image coding system |
US5121216A (en) * | 1989-07-19 | 1992-06-09 | Bell Communications Research | Adaptive transform coding of still images |
US5274715A (en) | 1989-09-21 | 1993-12-28 | Hsu Shin Yi | Characterizing image texture |
US5063444A (en) | 1990-03-19 | 1991-11-05 | At&T Bell Laboratories | High definition television arrangement with signal selections adapted to the available transmission capacity |
US5043808A (en) | 1990-03-19 | 1991-08-27 | At&T Bell Laboratories | High definition television arrangement employing motion compensated prediction error signals |
US5040062A (en) | 1990-03-19 | 1991-08-13 | At&T Bell Laboratories | Television signal arrangement where selected signals are encoded digitally |
US5134477A (en) | 1990-12-11 | 1992-07-28 | At&T Bell Laboratories | Hdtv receiver |
US5136377A (en) | 1990-12-11 | 1992-08-04 | At&T Bell Laboratories | Adaptive non-linear quantizer |
US5134475A (en) | 1990-12-11 | 1992-07-28 | At&T Bell Laboratories | Adaptive leak hdtv encoder |
US5144423A (en) | 1990-12-11 | 1992-09-01 | At&T Bell Laboratories | Hdtv encoder with forward estimation and constant rate motion vectors |
US5128756A (en) | 1990-12-11 | 1992-07-07 | At&T Bell Laboratories | High definition television coding arrangement with graceful degradation |
US5333212A (en) | 1991-03-04 | 1994-07-26 | Storm Technology | Image compression technique with regionally selective compression ratio |
US5559900A (en) | 1991-03-12 | 1996-09-24 | Lucent Technologies Inc. | Compression of signals for perceptual quality by selecting frequency bands having relatively high energy |
US5157488A (en) * | 1991-05-17 | 1992-10-20 | International Business Machines Corporation | Adaptive quantization within the jpeg sequential mode |
US5440344A (en) * | 1992-04-28 | 1995-08-08 | Mitsubishi Denki Kabushiki Kaisha | Video encoder using adjacent pixel difference for quantizer control |
US5305102A (en) | 1992-07-27 | 1994-04-19 | At&T Bell Laboratories | HDTV receiver |
US5331348A (en) | 1992-07-27 | 1994-07-19 | At&T Bell Laboratories | Adaptive leak HDTV encoder |
JP2800633B2 (ja) * | 1993-04-30 | 1998-09-21 | 富士ゼロックス株式会社 | 画像符号化装置 |
US5517327A (en) | 1993-06-30 | 1996-05-14 | Minolta Camera Kabushiki Kaisha | Data processor for image data using orthogonal transformation |
US5321522A (en) | 1993-07-19 | 1994-06-14 | Xerox Corporation | ADCT compression with minimum compression ratio |
US5426512A (en) | 1994-01-25 | 1995-06-20 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
US5719961A (en) * | 1994-07-22 | 1998-02-17 | Apple Computer, Inc. | Adaptive technique for encoder and decoder signal transformation |
US5629780A (en) | 1994-12-19 | 1997-05-13 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Image data compression having minimum perceptual error |
EP0735772A3 (en) * | 1995-03-27 | 1998-04-01 | Hewlett-Packard Company | Method for selecting JPEG quantization tables for low bandwidth applications |
JP3703195B2 (ja) | 1995-03-27 | 2005-10-05 | ヒューレット・パッカード・カンパニー | カラー画像伝送装置 |
US5661525A (en) | 1995-03-27 | 1997-08-26 | Lucent Technologies Inc. | Method and apparatus for converting an interlaced video frame sequence into a progressively-scanned sequence |
-
1998
- 1998-01-26 US US09/013,485 patent/US6252994B1/en not_active Expired - Lifetime
-
1999
- 1999-01-13 EP EP99300256A patent/EP0933947B1/en not_active Expired - Lifetime
- 1999-01-25 JP JP01616999A patent/JP4303818B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
EP0933947A3 (en) | 2000-03-08 |
EP0933947B1 (en) | 2012-06-27 |
EP0933947A2 (en) | 1999-08-04 |
US6252994B1 (en) | 2001-06-26 |
JPH11317944A (ja) | 1999-11-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4303818B2 (ja) | 画像符号化方法及び装置 | |
JP4355043B2 (ja) | デジタル画像の適応量子化のための画像ブロックのタイプ判定方法 | |
US6275620B2 (en) | Method and apparatus for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios | |
US5432870A (en) | Method and apparatus for compressing and decompressing images of documents | |
US5875041A (en) | Data processor | |
US6334001B2 (en) | Iterative smoothing technique for pre-processing mixed raster content planes to improve the quality of a decompressed image and increase document compression ratios | |
JP3005007B2 (ja) | 画像符号化装置 | |
JP3196906B2 (ja) | 画像信号の符号化装置 | |
US7499592B2 (en) | Image decoding apparatus and its control method | |
US7013050B2 (en) | Image encoding apparatus and method, program code, and storage medium | |
JPH08274998A (ja) | カラー画像を伝送する装置 | |
JPH04320160A (ja) | 画像信号圧縮伸長装置および領域識別処理装置 | |
JPH06121175A (ja) | 画像処理装置 | |
US8041135B2 (en) | Image encoding apparatus and control method thereof | |
JP2004120466A (ja) | 画像符号化装置、画像符号化方法、および画像処理装置 | |
JPH07123269A (ja) | 画像信号の符号化装置 | |
JP2000059782A (ja) | 空間領域デジタル画像の圧縮方法 | |
EP1006714A2 (en) | Method of processing mixed raster content planes | |
JP2007306513A (ja) | 画像データの圧縮方法および装置 | |
JP2910000B2 (ja) | 2値画像混在静止自然画像の符号化方法 | |
JP4486847B2 (ja) | 圧縮画像から中間調画像を作成する方法と装置 | |
Cheng et al. | Rate-distortion-based segmentation for MRC compression | |
EP1006711A2 (en) | Method and apparatus for processing a pixel map | |
Wong | Image halftoning using multipath tree coding | |
Thakare et al. | Scanned Compound Image Compression using Block based Pattern Matching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060119 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20060119 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090331 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090427 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120501 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130501 Year of fee payment: 4 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |