JP2001223903A - 走査された色付きおよびグレースケールの文書を圧縮する方法 - Google Patents
走査された色付きおよびグレースケールの文書を圧縮する方法Info
- Publication number
- JP2001223903A JP2001223903A JP2000368616A JP2000368616A JP2001223903A JP 2001223903 A JP2001223903 A JP 2001223903A JP 2000368616 A JP2000368616 A JP 2000368616A JP 2000368616 A JP2000368616 A JP 2000368616A JP 2001223903 A JP2001223903 A JP 2001223903A
- Authority
- JP
- Japan
- Prior art keywords
- image
- foreground
- background
- area
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 64
- 230000011218 segmentation Effects 0.000 claims abstract description 14
- 238000013139 quantization Methods 0.000 claims abstract description 13
- 238000001514 detection method Methods 0.000 claims description 13
- 238000012935 Averaging Methods 0.000 claims description 10
- 238000004458 analytical method Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012360 testing method Methods 0.000 claims description 3
- 230000035945 sensitivity Effects 0.000 claims description 2
- 230000003247 decreasing effect Effects 0.000 abstract 2
- 238000007906 compression Methods 0.000 description 13
- 230000006835 compression Effects 0.000 description 13
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000003044 adaptive effect Effects 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 238000011835 investigation Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 238000003708 edge detection Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Facsimile Image Signal Circuits (AREA)
- Processing Of Color Television Signals (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Color Television Systems (AREA)
Abstract
(57)【要約】 (修正有)
【課題】 走査された文書のデジタル像を三つの像面、
前景像、背景像および二進マスク像に分割し、走査され
た色付きおよび/またはグレースケールの文書を圧縮す
る方法を提示する。 【解決手段】 最初の文書から局部的に可変できるしき
い値像を形成し、量子化(二値化)により最初の像を用
いてビットによる量子化像を形成し、特定の減らした最
初の像により量子化を行い、文章の検出(セングメント
化)を量子化した像と最初の像から行って文書を前景領
域と背景領域に分割し、特定の領域、特に文章部分と図
形部分を前景像に付属させ、文章の背景と像を背景像に
付属させ、セグメント化の結果を最初の像の寸法に等し
い二進マスク像の中に保管し、最初の像とマスク像から
形成された分解能の減った前景像が前景領域の色を表
し、分解能の減った背景像を最初の像とマスク像から作
成し、次いで、二進マスク像、前景像および背景像を既
知の像符号化器を用いて符号化する。
前景像、背景像および二進マスク像に分割し、走査され
た色付きおよび/またはグレースケールの文書を圧縮す
る方法を提示する。 【解決手段】 最初の文書から局部的に可変できるしき
い値像を形成し、量子化(二値化)により最初の像を用
いてビットによる量子化像を形成し、特定の減らした最
初の像により量子化を行い、文章の検出(セングメント
化)を量子化した像と最初の像から行って文書を前景領
域と背景領域に分割し、特定の領域、特に文章部分と図
形部分を前景像に付属させ、文章の背景と像を背景像に
付属させ、セグメント化の結果を最初の像の寸法に等し
い二進マスク像の中に保管し、最初の像とマスク像から
形成された分解能の減った前景像が前景領域の色を表
し、分解能の減った背景像を最初の像とマスク像から作
成し、次いで、二進マスク像、前景像および背景像を既
知の像符号化器を用いて符号化する。
Description
【0001】
【発明の属する技術分野】この発明は、走査された文書
のデジタル像を三つの像面に分割して色付きおよびグレ
ースケールの走査された文書を圧縮する方法に関する。
のデジタル像を三つの像面に分割して色付きおよびグレ
ースケールの走査された文書を圧縮する方法に関する。
【0002】
【従来の技術】これ等の像面は前景、背景および二進マ
スク像である。マスク像は文書のどの領域が前景に属
し、何が背景に属するのかを表す。前景の成分は文章と
図形要素であり、これ等のカラーと強度は前景像により
表される。背景領域は文書の背景と文書の中にある絵を
含む。背景領域のカラーと強度は背景像により表せる。
三つの像の各々は適当な像符号化方法で別々に符号化さ
れる。符号化の間には文書が二進マスク、前景と背景の
像から集められる。二進マスク像は復元される文書が前
景像から発生する領域と背景像から発生する領域を識別
する。
スク像である。マスク像は文書のどの領域が前景に属
し、何が背景に属するのかを表す。前景の成分は文章と
図形要素であり、これ等のカラーと強度は前景像により
表される。背景領域は文書の背景と文書の中にある絵を
含む。背景領域のカラーと強度は背景像により表せる。
三つの像の各々は適当な像符号化方法で別々に符号化さ
れる。符号化の間には文書が二進マスク、前景と背景の
像から集められる。二進マスク像は復元される文書が前
景像から発生する領域と背景像から発生する領域を識別
する。
【0003】文書を高分解能走査して生じるデジタル像
データの量は大変なものである。例えばカラーA4版の
300 dpi走査は約 25,000,000 バイトを占め、カラーの
600dpi走査は 100,000,000バイトを占める。この大き
さは走査された文書を圧縮されていないデジタル像にす
ることを高価にし非実用的にする。遅い転送速度で回路
網を介してそのような文書を転送することは実際には不
可能である。
データの量は大変なものである。例えばカラーA4版の
300 dpi走査は約 25,000,000 バイトを占め、カラーの
600dpi走査は 100,000,000バイトを占める。この大き
さは走査された文書を圧縮されていないデジタル像にす
ることを高価にし非実用的にする。遅い転送速度で回路
網を介してそのような文書を転送することは実際には不
可能である。
【0004】JPEG規格(JPEG-LS )の損失のないモ
ードあるいは Lempel-Ziv Welch(LZW)アルゴリズム
のような損失のない圧縮方法を用いてのみ非常に低い圧
縮率が得られる。より大きい圧縮率は損失を受ける圧縮
方法を使用してのみ可能である。Joint Pictures Exper
t Group のDCTに基づく「JPEG法」は標準的な方
法であると考えられる。しかしJPEG法もより新しい
より良く波面に基づく圧縮方法は高い圧縮率を使用して
走査された文書を圧縮するのに適している。これ等の厳
しい画像圧縮方法は大きな局部相関に特徴のある典型的
な画像信号の統計を想定している。これ等の想定は走査
された文書に適用されず、文書の文章は大きな圧縮率で
変更されていて、しばしばもはや判読できない文章にな
る。現在のところ、達成するための文書は通常白黒にし
て走査され、CCITTIファックス圧縮規格「ファッ
クス・第3類」あるいは「ファックス・第4類」で圧縮
されている。一般に判読可能性はこれ等の厳しい二進圧
縮方法で保持されている。しかし、文書の明るさとカラ
ー情報は全く失われる。
ードあるいは Lempel-Ziv Welch(LZW)アルゴリズム
のような損失のない圧縮方法を用いてのみ非常に低い圧
縮率が得られる。より大きい圧縮率は損失を受ける圧縮
方法を使用してのみ可能である。Joint Pictures Exper
t Group のDCTに基づく「JPEG法」は標準的な方
法であると考えられる。しかしJPEG法もより新しい
より良く波面に基づく圧縮方法は高い圧縮率を使用して
走査された文書を圧縮するのに適している。これ等の厳
しい画像圧縮方法は大きな局部相関に特徴のある典型的
な画像信号の統計を想定している。これ等の想定は走査
された文書に適用されず、文書の文章は大きな圧縮率で
変更されていて、しばしばもはや判読できない文章にな
る。現在のところ、達成するための文書は通常白黒にし
て走査され、CCITTIファックス圧縮規格「ファッ
クス・第3類」あるいは「ファックス・第4類」で圧縮
されている。一般に判読可能性はこれ等の厳しい二進圧
縮方法で保持されている。しかし、文書の明るさとカラ
ー情報は全く失われる。
【0005】現在企画段階にある Mixed Raster Conten
t 規格 (MRC)(ITU推奨T.44)はこれ等の問題
を解決する試みである。この規格により文書は適当な符
号化方法を使用してそれぞれ別々に符号化されている複
数の領域に分割される。MRC規格の一モードは多層符
号化モードであり、このモードは文書を先に説明した三
つの面に分割するためにある。しかし、MRC規格では
復号化処理のみが曖昧さなしに固定されている。符号化
中に文書を三つの像面に分割する方法は指定されていな
い。この多層符号化モードを使用する方法は米国特許第
5,779,092号明細書に開示されている。しかし、この方
法は広範な文書で満足されない条件を指定している。特
にこの方法は文書内の全ての像が長方形で、文書の背景
が白色か明るく、像内に文章が見出せないことを想定し
ている。
t 規格 (MRC)(ITU推奨T.44)はこれ等の問題
を解決する試みである。この規格により文書は適当な符
号化方法を使用してそれぞれ別々に符号化されている複
数の領域に分割される。MRC規格の一モードは多層符
号化モードであり、このモードは文書を先に説明した三
つの面に分割するためにある。しかし、MRC規格では
復号化処理のみが曖昧さなしに固定されている。符号化
中に文書を三つの像面に分割する方法は指定されていな
い。この多層符号化モードを使用する方法は米国特許第
5,779,092号明細書に開示されている。しかし、この方
法は広範な文書で満足されない条件を指定している。特
にこの方法は文書内の全ての像が長方形で、文書の背景
が白色か明るく、像内に文章が見出せないことを想定し
ている。
【0006】
【発明が解決しようとする課題】この発明の課題は、明
るい背景、長方形の図面のような最初の文書の特性や像
と文書部分の正確な分離により制限されることなく、走
査された文書の圧縮を可能にすることにある。更に、計
算時間の経費や記憶器の使用を最小限に減らすべきであ
る。更に、若干の制御パラメータにより統一的な方法に
より異なった類の文書や像を圧縮すべきである。
るい背景、長方形の図面のような最初の文書の特性や像
と文書部分の正確な分離により制限されることなく、走
査された文書の圧縮を可能にすることにある。更に、計
算時間の経費や記憶器の使用を最小限に減らすべきであ
る。更に、若干の制御パラメータにより統一的な方法に
より異なった類の文書や像を圧縮すべきである。
【0007】
【課題を解決するための手段】上記の課題は、この発明
により、走査された文書のデジタル像を三つの像面、前
景像、背景像および二進マスク像に分割し、最初の文書
から局部的に可変できるしきい値像を形成し、量子化
(二値化)により最初の像を用いてビットによる量子化
像を形成する、走査された色付きおよび/またはグレー
スケールの文書を圧縮する方法にあって、特定の減らし
た最初の像により量子化を行い、文章の検出(セングメ
ント化)を量子化した像と最初の像から行って文書を前
景領域と背景領域に分割し、特定の領域、特に文章部分
と図形部分を前景像に付属させ、文章の背景と像を背景
像に付属させ、セグメント化の結果を最初の像の寸法に
等しい二進マスク像の中に保管し、最初の像とマスク像
から形成された分解能の減った前景像が前景領域の色を
表し、分解能の減った背景像を最初の像とマスク像から
作成し、次いで、二進マスク像、前景像および背景像を
既知の像符号化器を用いて符号化する、ことによって解
決されている。
により、走査された文書のデジタル像を三つの像面、前
景像、背景像および二進マスク像に分割し、最初の文書
から局部的に可変できるしきい値像を形成し、量子化
(二値化)により最初の像を用いてビットによる量子化
像を形成する、走査された色付きおよび/またはグレー
スケールの文書を圧縮する方法にあって、特定の減らし
た最初の像により量子化を行い、文章の検出(セングメ
ント化)を量子化した像と最初の像から行って文書を前
景領域と背景領域に分割し、特定の領域、特に文章部分
と図形部分を前景像に付属させ、文章の背景と像を背景
像に付属させ、セグメント化の結果を最初の像の寸法に
等しい二進マスク像の中に保管し、最初の像とマスク像
から形成された分解能の減った前景像が前景領域の色を
表し、分解能の減った背景像を最初の像とマスク像から
作成し、次いで、二進マスク像、前景像および背景像を
既知の像符号化器を用いて符号化する、ことによって解
決されている。
【0008】この発明による他の有利な構成は特許請求
の範囲の従属請求項に記載されている。
の範囲の従属請求項に記載されている。
【0009】
【発明の実施の形態】この発明によれば、文書を全体と
して符号化する画像符号化方法を用いることよりも、走
査された文書を上に説明した三つの像面に分割してより
良い圧縮結果を得ることができる。この発明は二進マス
ク像を求める新し方法と最初の文書を前景と背景の像に
効果的に分割する方法を記載している。文書の特性ある
いは構成に関して特別な想定は行っていない。
して符号化する画像符号化方法を用いることよりも、走
査された文書を上に説明した三つの像面に分割してより
良い圧縮結果を得ることができる。この発明は二進マス
ク像を求める新し方法と最初の文書を前景と背景の像に
効果的に分割する方法を記載している。文書の特性ある
いは構成に関して特別な想定は行っていない。
【0010】走査された文書を圧縮する新しい方法を導
入している。文書を三つの面、つまり前景像、背景像お
よびマスク像に分割することを前提として、この圧縮方
法の基礎的な順序を説明する。
入している。文書を三つの面、つまり前景像、背景像お
よびマスク像に分割することを前提として、この圧縮方
法の基礎的な順序を説明する。
【0011】先ず、適応的なしきい値方法を用いて最初
の文書から場所的に可変するしきい値像を発生させる。
ビットで量子化された像を発生するこのしきい値像を使
用して、最初の画像を量子化する。文書検出(セグメン
ト化)方法はビットで量子化された像と最初の像を利用
し、文書を前景と背景の領域に分割し、文章と図形を前
景領域とし、像と文章背景を背景領域として分類する。
前景と背景の領域を合わせるマスクを文章検出方法で形
成する。前景領域のカラーを記述する分解能の落ちた前
景像を最初の像とマスク像から形成する。適当な像コー
ドを使用し、マスク像、背景像および前景像を最終的に
別々に符号化する。
の文書から場所的に可変するしきい値像を発生させる。
ビットで量子化された像を発生するこのしきい値像を使
用して、最初の画像を量子化する。文書検出(セグメン
ト化)方法はビットで量子化された像と最初の像を利用
し、文書を前景と背景の領域に分割し、文章と図形を前
景領域とし、像と文章背景を背景領域として分類する。
前景と背景の領域を合わせるマスクを文章検出方法で形
成する。前景領域のカラーを記述する分解能の落ちた前
景像を最初の像とマスク像から形成する。適当な像コー
ドを使用し、マスク像、背景像および前景像を最終的に
別々に符号化する。
【0012】最初の文書の量子化は二過程で行われる。
第一過程では、適応性しきい値方法を用いて、局部的に
可変できるしきい値像を求める。第二過程では、最初の
文書のグレー値表示をしきい値像と比較して二進量子化
像を発生させる。
第一過程では、適応性しきい値方法を用いて、局部的に
可変できるしきい値像を求める。第二過程では、最初の
文書のグレー値表示をしきい値像と比較して二進量子化
像を発生させる。
【0013】最初の文書が色付きであれば、この文書を
先ずグレースケール像と二つのカラー差成分像に変換す
る。グレースケール像は局部的に可変できるを求めるた
めに使用される。先ず低域通過フィルタ・サブサンプリ
ングを使用して、限定版のグレースケール像を形成す
る。フィルタとサブサンプリングの助けは最初の走査で
の局部的な歪みと雑音、ジッターおよびラスター作用を
減らす。
先ずグレースケール像と二つのカラー差成分像に変換す
る。グレースケール像は局部的に可変できるを求めるた
めに使用される。先ず低域通過フィルタ・サブサンプリ
ングを使用して、限定版のグレースケール像を形成す
る。フィルタとサブサンプリングの助けは最初の走査で
の局部的な歪みと雑音、ジッターおよびラスター作用を
減らす。
【0014】次に、局部的な動的分析を行う。最小と最
大のフィルタを低減させたグレースケール像に適用して
最小と最大の像を発生させる。最小と最大の像の間の差
を用いて、動的像を発生させる。文章の領域のような強
いエッジを含む領域は動的な像の中で大きな値を有す
る。
大のフィルタを低減させたグレースケール像に適用して
最小と最大の像を発生させる。最小と最大の像の間の差
を用いて、動的像を発生させる。文章の領域のような強
いエッジを含む領域は動的な像の中で大きな値を有す
る。
【0015】次に、動的な像を最初動的値と比較する。
動的な像が最小の動特性よりも高い動特性を示す領域で
は、量子化するしきい値像を対応する最初の像と最大の
像の値の和の半分であるとして求める。動的な像の値が
最小の動特性より小さい領域に対して量子化するしきい
値を最初ゼロに等しいと設定する。最小の動的値は外部
で指定でき、量子化と文章検出の感度を制御する。
動的な像が最小の動特性よりも高い動特性を示す領域で
は、量子化するしきい値像を対応する最初の像と最大の
像の値の和の半分であるとして求める。動的な像の値が
最小の動特性より小さい領域に対して量子化するしきい
値を最初ゼロに等しいと設定する。最小の動的値は外部
で指定でき、量子化と文章検出の感度を制御する。
【0016】平均化フィルタはゼロでないしきい値の全
てに対して使用される。この助けは以前に形成されたし
きい値の強い局部的変動やエッジ形成物を低減する。次
いで、平均化されたしきい値を接続画素へ拡張する。
てに対して使用される。この助けは以前に形成されたし
きい値の強い局部的変動やエッジ形成物を低減する。次
いで、平均化されたしきい値を接続画素へ拡張する。
【0017】今度は平均化フィルタをしきい値がゼロで
ない全ての画素に使用する。新しく計算した値をしきい
値像に直接書き込む。その結果、ただ一つのパスを持つ
全ての画素に対するしきい値を決めることができる。
ない全ての画素に使用する。新しく計算した値をしきい
値像に直接書き込む。その結果、ただ一つのパスを持つ
全ての画素に対するしきい値を決めることができる。
【0018】発生したしきい値像は最初の文書より小さ
く、最後に大きくして量子化のための最初の寸法にす
る。この像は双一次内挿を用いて寸法を決め、単純な画
素繰返を使用して拡大により生じる多くの量子化人為発
生物を防止し、より良い符号化性能となる。
く、最後に大きくして量子化のための最初の寸法にす
る。この像は双一次内挿を用いて寸法を決め、単純な画
素繰返を使用して拡大により生じる多くの量子化人為発
生物を防止し、より良い符号化性能となる。
【0019】二進量子化像は文章検出の出発点であり、
この発明の方法の第二の領域である。文章検出(セグメ
ント化)の目的は最初の像を前景と背景の領域に画素毎
に指定することを表す二進マスク像を形成することにあ
る。前景に属するとして検出した文章と図形構造は二進
マスク像内で黒として表され、背景領域は白として表さ
れる。
この発明の方法の第二の領域である。文章検出(セグメ
ント化)の目的は最初の像を前景と背景の領域に画素毎
に指定することを表す二進マスク像を形成することにあ
る。前景に属するとして検出した文章と図形構造は二進
マスク像内で黒として表され、背景領域は白として表さ
れる。
【0020】この発明により、セグメント化は前景部分
に対する候補として量子化された像中の同じ値の全ての
接続領域を扱う。これ等の領域を更に調べ、分類する前
に判定基準の範囲を使用して分析する。領域の分類をマ
スクに入れる。文章を検出する間にはマスクは二進でな
く、領域は「未だ調べていない」、「前景」、「背景」
あるいは「穴」として分類される。
に対する候補として量子化された像中の同じ値の全ての
接続領域を扱う。これ等の領域を更に調べ、分類する前
に判定基準の範囲を使用して分析する。領域の分類をマ
スクに入れる。文章を検出する間にはマスクは二進でな
く、領域は「未だ調べていない」、「前景」、「背景」
あるいは「穴」として分類される。
【0021】第一過程として、量子化された像の接続さ
れた全ての領域を判別する。このため、4折りの近辺を
分解能の高い文書に使用し、分解能の低いの文書に対し
て8折りの近辺を使用する。接続された領域を決めた
後、その寸法を分解能に依存する最小と最大の領域の寸
法と比較する。これ等の限界の下または上の接続された
領域を「背景」と分類し、これ等の限界内の領域を更に
調べる。
れた全ての領域を判別する。このため、4折りの近辺を
分解能の高い文書に使用し、分解能の低いの文書に対し
て8折りの近辺を使用する。接続された領域を決めた
後、その寸法を分解能に依存する最小と最大の領域の寸
法と比較する。これ等の限界の下または上の接続された
領域を「背景」と分類し、これ等の限界内の領域を更に
調べる。
【0022】次に、標準エッジフィルタを使用して接続
された領域の全ての縁画素を調べる。エッジフィルタの
応答の絶対値を縁画素に対するエッジ能力として使用す
る。次いで、雑音の作用を低減するため、これ等のエッ
ジ能力を最小能力値と比較する。エッジ能力値が最小値
より小さいなら、エッジ能力値をゼロに等しくする。次
に、一つの領域の縁部分に対する平均および最小のエッ
ジ能力をこの領域内の画素に対する偏差と共に計算す
る。
された領域の全ての縁画素を調べる。エッジフィルタの
応答の絶対値を縁画素に対するエッジ能力として使用す
る。次いで、雑音の作用を低減するため、これ等のエッ
ジ能力を最小能力値と比較する。エッジ能力値が最小値
より小さいなら、エッジ能力値をゼロに等しくする。次
に、一つの領域の縁部分に対する平均および最小のエッ
ジ能力をこの領域内の画素に対する偏差と共に計算す
る。
【0023】次の過程は平均エッジ能力や最大エッジ能
力が特定な最小値以上にある否かおよび内部領域の偏差
が最大値以下にある否かを調べる。
力が特定な最小値以上にある否かおよび内部領域の偏差
が最大値以下にある否かを調べる。
【0024】これ等の試験が肯定的であれば、その領域
を前景領域として分類し、マスク像の中にそのようなも
のとして入れる。この領域が既に前景として分類されて
いる異なった領域に触れていれば、この領域をマスクの
中に「穴」として入れる。これ等の試験が否定的であれ
ば、この領域を背景と分類し、これもマクスの中に入れ
る。
を前景領域として分類し、マスク像の中にそのようなも
のとして入れる。この領域が既に前景として分類されて
いる異なった領域に触れていれば、この領域をマスクの
中に「穴」として入れる。これ等の試験が否定的であれ
ば、この領域を背景と分類し、これもマクスの中に入れ
る。
【0025】分類した後には、前景領域を黒にし、他の
全ての領域を白にしてマスク像を量子化する。
全ての領域を白にしてマスク像を量子化する。
【0026】文章検出には異なった四つの動作モードが
ある。上に説明した処置は明るい背景上の暗い文章や暗
い背景上の明るい文章を検出できるモードに相当する。
第二のモードは、単純な文字を含み、文章が必ず暗く、
背景が明るい全ての文書に対して使用される。第三のモ
ードはセグメント化が非常に困難な地図のような文書に
有効である。このモードでは、量子化された像の暗い全
ての領域を自動的に前景領域と見なす。こうして、セグ
メント化することが困難な文書でも満足な符号化結果が
得られる。第四のモードは全ての画素を背景画素として
分類するものである。これは符号化が文書を厳密に映像
化する場合に有益である。
ある。上に説明した処置は明るい背景上の暗い文章や暗
い背景上の明るい文章を検出できるモードに相当する。
第二のモードは、単純な文字を含み、文章が必ず暗く、
背景が明るい全ての文書に対して使用される。第三のモ
ードはセグメント化が非常に困難な地図のような文書に
有効である。このモードでは、量子化された像の暗い全
ての領域を自動的に前景領域と見なす。こうして、セグ
メント化することが困難な文書でも満足な符号化結果が
得られる。第四のモードは全ての画素を背景画素として
分類するものである。これは符号化が文書を厳密に映像
化する場合に有益である。
【0027】低減された前景像は二進マスク像と最初の
像により作成される。最初に、前景に属する全ての領域
を二進マスク像内で判別する。一つの領域の縁画素はこ
の領域が全体として代表しない強度もしくは色を持って
いて、そのためこれ等の画素は前景領域の各々を一画素
だけ薄くして除去されが、各領域の少なくとも骨格を残
すことを保証する。
像により作成される。最初に、前景に属する全ての領域
を二進マスク像内で判別する。一つの領域の縁画素はこ
の領域が全体として代表しない強度もしくは色を持って
いて、そのためこれ等の画素は前景領域の各々を一画素
だけ薄くして除去されが、各領域の少なくとも骨格を残
すことを保証する。
【0028】次いで、最初の像と薄くした二進マスク像
を前景像低減係数に対応するブロックのエッジの長さを
有するブロックに分割する。一つのブロックが薄くした
前景領域の一部を含めば、最初の文書内の対応する画素
の平均値をそのブロックについて計算し、低減させた前
景像内の対応する場所に書き込む。
を前景像低減係数に対応するブロックのエッジの長さを
有するブロックに分割する。一つのブロックが薄くした
前景領域の一部を含めば、最初の文書内の対応する画素
の平均値をそのブロックについて計算し、低減させた前
景像内の対応する場所に書き込む。
【0029】一つのブロックが薄くされた前景領域を含
まなければ、前景像の値をゼロにする。ゼロでない前景
画素を使用する平均フィルタを使用して前景値を関連す
る画素へ拡張する。
まなければ、前景像の値をゼロにする。ゼロでない前景
画素を使用する平均フィルタを使用して前景値を関連す
る画素へ拡張する。
【0030】最後の過程では、平均フィルタを使用して
残った全ての画素をある値と指定する。符号化の効率を
高めるため、平均値の形成で一定のグレー値を付加的な
部分として入れ、前景領域のない領域で前景像をグレー
に減衰させる。新しく計算された前景値は前景像の中に
直接書き込まれ、一回の試行で像の全ての画素を決める
ことができる。
残った全ての画素をある値と指定する。符号化の効率を
高めるため、平均値の形成で一定のグレー値を付加的な
部分として入れ、前景領域のない領域で前景像をグレー
に減衰させる。新しく計算された前景値は前景像の中に
直接書き込まれ、一回の試行で像の全ての画素を決める
ことができる。
【0031】背景像の決定は、原則的に、前景像を求め
るために使用される方法に一致し、この処理を相補像、
つまり反転二進マスク像を用いて行う例外がある。
るために使用される方法に一致し、この処理を相補像、
つまり反転二進マスク像を用いて行う例外がある。
【0032】背景に属する全ての領域を二進マスク像内
で判別する。一つの領域の縁画素はこの領域を全体とし
て代表しない強度またはカラーを有するので、これ等の
画素は背景領域の各々を一画素だけ薄くして除去される
が、各領域の少なくとも骨格を残すことを保証してい
る。
で判別する。一つの領域の縁画素はこの領域を全体とし
て代表しない強度またはカラーを有するので、これ等の
画素は背景領域の各々を一画素だけ薄くして除去される
が、各領域の少なくとも骨格を残すことを保証してい
る。
【0033】最初の像および薄くされた反転二進マスク
像をもう一度ブロックに分割する。これ等のブロックの
エッジの長さは背景像に対する低減係数に対応する。一
つのブロックが薄くされた背景領域の一部を含むと、こ
のブロックに対して最初の文書の対応する画素の平均値
を計算し、低減された背景像に書き込む。一つのブロッ
クが薄くされた背景領域を含まなければ、背景像の対応
する画素をゼロにする。ゼロでない背景画素を使用する
平均フィルタを使用して背景値を隣接する画素に広げ
る。
像をもう一度ブロックに分割する。これ等のブロックの
エッジの長さは背景像に対する低減係数に対応する。一
つのブロックが薄くされた背景領域の一部を含むと、こ
のブロックに対して最初の文書の対応する画素の平均値
を計算し、低減された背景像に書き込む。一つのブロッ
クが薄くされた背景領域を含まなければ、背景像の対応
する画素をゼロにする。ゼロでない背景画素を使用する
平均フィルタを使用して背景値を隣接する画素に広げ
る。
【0034】最後の過程では、平均フィルタを使用し
て、残っている全ての画素をある値に指定する。符号化
効率を高めるため、平均値を形成する場合に一定のグレ
ー値を付加的な部分として含め、背景像を背景領域のな
い領域のグレーに減衰させる。新たに計算された背景値
を背景像に直接書き込み、一回の試行だけで像の全ての
画素を決めることができる。
て、残っている全ての画素をある値に指定する。符号化
効率を高めるため、平均値を形成する場合に一定のグレ
ー値を付加的な部分として含め、背景像を背景領域のな
い領域のグレーに減衰させる。新たに計算された背景値
を背景像に直接書き込み、一回の試行だけで像の全ての
画素を決めることができる。
【0035】全ての前景像、背景像および二進マスク像
をこの発明の方法で作成していれば、これ等は適当な画
像符号器で圧縮される。
をこの発明の方法で作成していれば、これ等は適当な画
像符号器で圧縮される。
【0036】復号化は前景像、背景像および二進マスク
像を最初に別々に復号化することから成る。低減された
背景像と前景像は内挿によりマスク像の寸法に拡大され
る。二進マスク像の値に応じて、復元された像を拡大さ
れた背景像と前景像の画素から組み立てる。
像を最初に別々に復号化することから成る。低減された
背景像と前景像は内挿によりマスク像の寸法に拡大され
る。二進マスク像の値に応じて、復元された像を拡大さ
れた背景像と前景像の画素から組み立てる。
【0037】
【実施例】以下、この発明を一例によりより詳しく説明
する。
する。
【0038】この例では、最初の文書(図6)は黒と色
付きの文章部分を有する色付きの 300 dpi文書である。
この文書を先ず局部的に可変できるしきい値像を求める
ために使用するグレースケール像(図2)と二つの色差
成分像に変換する。このグレースケール像を低域通過フ
ィルタとそれに続くサブサンプリングで 150 dpiに減ら
す。次いで、減らしたグレースケール像を局部的な動的
分析の範囲内で3×3核の最大/最小濾波にかける。最
大像と最小像の間の差から、動的像を得る。この像を次
の過程で55の最小動特性と比較する。この最小値を越
えた領域に対して、文章領域への分類を想定し、量子化
されたしきい値を最大像と最小像の和の半分から算出す
る。他方、動特性の少ない領域に対してこの量子化しき
い値を最初にゼロに等しくする。次に、ゼロに等しくな
い全てのしきい値を3×3核の平均化にかける。こうし
て、平均化されたこれ等の値を他の5×5平均フィルタ
を用いて隣接する画素へ拡張する。次に、しきい値の未
だ決まっていない画素を7×7平均化フィルタを用いて
詰め込む。量子化のためこのしきい値像を共一次内挿に
より最初の大きさに戻す。グレースケール像をしきい値
と比較して、量子化された二進像を図7により形成す
る。この量子化された二進像は図3の次の文章検出(セ
グメント化)の基礎となる。
付きの文章部分を有する色付きの 300 dpi文書である。
この文書を先ず局部的に可変できるしきい値像を求める
ために使用するグレースケール像(図2)と二つの色差
成分像に変換する。このグレースケール像を低域通過フ
ィルタとそれに続くサブサンプリングで 150 dpiに減ら
す。次いで、減らしたグレースケール像を局部的な動的
分析の範囲内で3×3核の最大/最小濾波にかける。最
大像と最小像の間の差から、動的像を得る。この像を次
の過程で55の最小動特性と比較する。この最小値を越
えた領域に対して、文章領域への分類を想定し、量子化
されたしきい値を最大像と最小像の和の半分から算出す
る。他方、動特性の少ない領域に対してこの量子化しき
い値を最初にゼロに等しくする。次に、ゼロに等しくな
い全てのしきい値を3×3核の平均化にかける。こうし
て、平均化されたこれ等の値を他の5×5平均フィルタ
を用いて隣接する画素へ拡張する。次に、しきい値の未
だ決まっていない画素を7×7平均化フィルタを用いて
詰め込む。量子化のためこのしきい値像を共一次内挿に
より最初の大きさに戻す。グレースケール像をしきい値
と比較して、量子化された二進像を図7により形成す
る。この量子化された二進像は図3の次の文章検出(セ
グメント化)の基礎となる。
【0039】文章検出方法では、先ず図2により形成さ
れた量子化像の接続する全ての領域を判別する。4折り
の周辺を例として使用する。最小と最大の領域寸法を指
定する。これ等の限界を有する領域を背景と分類する。
これに非線形エッジ検出が続く。調べている領域の全て
のエッジ画素を水平および垂直のソベル(Sobel)フィル
タとラプラス(Laplace)フィルタで分析する。求めたエ
ッジ能力を最小能力値と比較し、この値以下であれば、
ゼロにする。平均エッジ能力と最大エッジ能力、および
内部領域の偏差を次の過程で求め、次いで平均エッジ能
力と最大エッジ能力が指定された最小値以上であるか否
か、および内部領域の偏差が最大値以下であるか否かを
調べるために検査する。肯定的な結果であれば、実際の
領域を前景領域と分類し、マスク像に入れる。この領域
が先に前景と分類された領域に接触すれば、この領域を
「穴」として記録する。否定的な結果の場合には、調べ
ている領域を背景領域としてマスク像に入る。次いで、
分類されたマスク像を二値化する。この像の中では前景
領域が「黒」にされ、背景領域と「穴」は「白」にされ
る(図8)。例とする文書をモード1に従ってセグメン
ト化する。
れた量子化像の接続する全ての領域を判別する。4折り
の周辺を例として使用する。最小と最大の領域寸法を指
定する。これ等の限界を有する領域を背景と分類する。
これに非線形エッジ検出が続く。調べている領域の全て
のエッジ画素を水平および垂直のソベル(Sobel)フィル
タとラプラス(Laplace)フィルタで分析する。求めたエ
ッジ能力を最小能力値と比較し、この値以下であれば、
ゼロにする。平均エッジ能力と最大エッジ能力、および
内部領域の偏差を次の過程で求め、次いで平均エッジ能
力と最大エッジ能力が指定された最小値以上であるか否
か、および内部領域の偏差が最大値以下であるか否かを
調べるために検査する。肯定的な結果であれば、実際の
領域を前景領域と分類し、マスク像に入れる。この領域
が先に前景と分類された領域に接触すれば、この領域を
「穴」として記録する。否定的な結果の場合には、調べ
ている領域を背景領域としてマスク像に入る。次いで、
分類されたマスク像を二値化する。この像の中では前景
領域が「黒」にされ、背景領域と「穴」は「白」にされ
る(図8)。例とする文書をモード1に従ってセグメン
ト化する。
【0040】図4により、減らした前景像を二進マスク
像と最初の像から形成する。前景領域の全てを最初に一
画素だけ薄くし、最初の文書をこの薄くした二進マスク
像により3分の1の寸法に減らす。これを達成するた
め、マスク像と最初の像を3×3画素のブロックに分割
する。そのような3×3ブロック内の薄くされた前景領
域の画素に対して、これ等の画素の平均値を算出し、減
らした前景像に書き込む。3×3ブロックが薄くされた
前景領域を含まないなら、対応する画素をゼロにする。
次に、ゼロより大きい値の前景画素を5×5平均値フィ
ルタを用いて拡張し、5×5フィルタを用いて平均値形
成で付加的な部分として含まれ一定のグレー値で残りの
画素を満たす。図5の背景像を求めるため、背景に属す
る全ての領域を二進マスク像内で判別し、これ等の背景
領域も一画素だけ薄くする。次いで、最初の像と薄くし
たマスク像を3×3ブロックに分割する。その後は、こ
の処置は前景像を求めるために使用されるものと同じで
ある。この結果は図10に示されている。
像と最初の像から形成する。前景領域の全てを最初に一
画素だけ薄くし、最初の文書をこの薄くした二進マスク
像により3分の1の寸法に減らす。これを達成するた
め、マスク像と最初の像を3×3画素のブロックに分割
する。そのような3×3ブロック内の薄くされた前景領
域の画素に対して、これ等の画素の平均値を算出し、減
らした前景像に書き込む。3×3ブロックが薄くされた
前景領域を含まないなら、対応する画素をゼロにする。
次に、ゼロより大きい値の前景画素を5×5平均値フィ
ルタを用いて拡張し、5×5フィルタを用いて平均値形
成で付加的な部分として含まれ一定のグレー値で残りの
画素を満たす。図5の背景像を求めるため、背景に属す
る全ての領域を二進マスク像内で判別し、これ等の背景
領域も一画素だけ薄くする。次いで、最初の像と薄くし
たマスク像を3×3ブロックに分割する。その後は、こ
の処置は前景像を求めるために使用されるものと同じで
ある。この結果は図10に示されている。
【0041】この例に従って作成される前景像、背景像
および二進マスク像を次に適当な像符号化器を用いて圧
縮する。マスク像を例えば「Fax Group 4 」で、また前
景像と背景像を波面符号化で圧縮する。これ等の三つの
像を別々に復号化し、減らした前景像と背景像を線形内
挿により二進マスク像の寸法に合わせる。二進マスク像
の画素が黒であれば、寸法合わせした前景像の対応する
画素を復元された文書に使用し、そうでなければ寸法合
わせした背景像の対応する画素を使用する。
および二進マスク像を次に適当な像符号化器を用いて圧
縮する。マスク像を例えば「Fax Group 4 」で、また前
景像と背景像を波面符号化で圧縮する。これ等の三つの
像を別々に復号化し、減らした前景像と背景像を線形内
挿により二進マスク像の寸法に合わせる。二進マスク像
の画素が黒であれば、寸法合わせした前景像の対応する
画素を復元された文書に使用し、そうでなければ寸法合
わせした背景像の対応する画素を使用する。
【0042】
【発明の効果】以上、説明したように、この発明の方法
により以下の利点が得られる。即ち、ここに示すこの発
明のデータ圧縮法を用いて、明るい背景、長方形の図面
のようなその特性や像部分を文章部分から正確に分離す
ることにより制限されることなく、走査された文書を圧
縮できる。更に、計算時間の経費や記憶容量の使用が最
小に低減される。加えて、異なった類の文書や異なった
像を統一された方法で初めて圧縮できる。
により以下の利点が得られる。即ち、ここに示すこの発
明のデータ圧縮法を用いて、明るい背景、長方形の図面
のようなその特性や像部分を文章部分から正確に分離す
ることにより制限されることなく、走査された文書を圧
縮できる。更に、計算時間の経費や記憶容量の使用が最
小に低減される。加えて、異なった類の文書や異なった
像を統一された方法で初めて圧縮できる。
【図1】 この方法のブロック図を示す。
【図2】 しきい値を決める共に最初の像を量子化する
までの方法の過程を示す。
までの方法の過程を示す。
【図3】 この方法の文章検出とセグメント化過程を示
す。
す。
【図4】 前景像を求める方法の過程を示す。
【図5】 背景像を求める方法の過程を示す。
【図6】 最初の文書の一例を示す。
【図7】 最初の文書の量子化された像を示す。
【図8】 セグメント化の結果を示す。
【図9】 この方法の前景像を示す。
【図10】 この方法の背景像を示す。
【図11】 最初の文書の復号化された復元を示す。
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ジモン・マックパルトリン ドイツ連邦共和国、10245ベルリン、ボッ クスハーゲナー・ストラーセ、87 (72)発明者 ミッヒヤエル・テイールシユマン ドイツ連邦共和国、14197ベルリン、ラン トアウエルストラーセ、2
Claims (9)
- 【請求項1】 走査された文書のデジタル像を三つの像
面、前景像、背景像および二進マスク像に分割し、最初
の文書から局部的に可変できるしきい値像を形成し、量
子化(二値化)により最初の像を用いてビットによる量
子化像を形成する、走査された色付きおよび/またはグ
レースケールの文書を圧縮する方法において、 特定の減らした最初の像により量子化を行い、文章の検
出(セングメント化)を量子化した像と最初の像から行
って文書を前景領域と背景領域に分割し、 特定の領域、特に文章部分と図形部分を前景像に付属さ
せ、文章の背景と像を背景像に付属させ、 セグメント化の結果を最初の像の寸法に等しい二進マス
ク像の中に保管し、 最初の像とマスク像から形成された分解能の減った前景
像が前景領域の色を表し、 分解能の減った背景像を最初の像とマスク像から作成
し、 次いで、二進マスク像、前景像および背景像を既知の像
符号化器を用いて符号化する、ことを特徴とする方法。 - 【請求項2】最初の文書の量子化(二値化)を二段過程
で行い、最初に局部的に可変できるしきい値を適応的に
減らした初期値から求め、次いで最初の文書のグレー値
表示と比較し、 色付き文書を一つのグレースケール像と二つの色差成分
像とに変換し、 グレースケール像を次にサブサンプリングにより適当な
寸法の低域濾波に減らし、 減らしたグレースケール像の局部的な動的分析により動
的像を形成し、 量子化や文章検出(セグメント化)の感度を制御する外
部から指定できる最小の動特性と前記動的像を比較し、 この最小値を越えた時、最小/最大像の和の半分から量
子化されたしきい値を求め、 不適当な動特性の領域では、量子化するしきい値をゼロ
にし、 ゼロでない全てのしきい値に対して平均値を形成し、低
域通過濾波された平均しきい値を広げ、 共一次内挿によりしきい値像を拡げ、最初の文書のグレ
ースケール像と比較する、ことを特徴とする請求項1に
記載の方法。 - 【請求項3】量子化された二進像と最初の像を文章検出
(セグメント化)にかけ、そのために許容される寸法の
接続されている全ての領域を選び、 同じ値の量子化像の接続された全ての領域をその安定性
に関して前景成分として評価し、 前景としてセグメント化された領域を二進マスク像に入
れ、 文書のタイプに応じて異なる四つのモードに従いセグメ
ント化を行い、 セグメント化の結果として形成された二進マスク像が全
ての文書領域を前景領域と背景領域に画素毎に割り当て
ることを可能にする(図3),ことを特徴とする請求項
1または2に記載の方法。 - 【請求項4】減らした前景像を形成し、その中で薄くし
た二進マスク像と最初の像をブロックに分割し、それ等
のブロックの薄くした前景領域の平均値を減らした前景
像の中に入れて広げ、次いで未だ決まっていない前景像
の領域を所定の領域に対して平均化して詰め込み、一定
のグレー値を平均化の中の付加的な部分として入れる
(図4)、ことを特徴とする請求項1〜3の何れか1項
に記載の方法。 - 【請求項5】 減らした背景像を形成し、その中で薄く
した二進背景マスク像と最初の像をブロックに分割し、
これ等のブロックの薄くした背景領域の平均値を減らし
た背景像の中に入れて広げ、次いで未だ決まっていない
背景像の領域を求めた領域に対して平均化して詰め込む
(図5)、ことを特徴とする請求項1に記載の方法。 - 【請求項6】グレースケール像を低域通過濾波により最
初のものの半分に減らし、局部的な動的分析の範囲内
で、3×3核を使用して最小/最大フィルタにかけ、 3×3フィルタを用いて平均化したしきい値を他の5×
5平均値フィルタを用いて隣接する画素に広げ、 次いで、しきい値のない領域を7×7フィルタを用いて
満たす、ことを特徴とする請求項1または2に記載の方
法。 - 【請求項7】量子化された像の全ての領域を一貫して検
査にかけ、 同じ値の量子化像の接続している領域を非常に小さい領
域と非常に大きい領域を除去する寸法フィルタにかけ、 低いエッジ能力の領域を除去するエッジ能力試験にこれ
等の領域のエッジをかけ、 領域の偏差を除去する偏差判定に前記領域の内部領域を
かけ、 得られた領域が他の文章の領域に接触していなければ、
これ等の領域を前景と分類する、ことを特徴とする請求
項3に記載の方法。 - 【請求項8】量子化された像の白と黒の接続した領域を
探して正常なおよび反転した文章に対する第一モードに
よりセグメント化する方法の過程(図3)を行い、 量子化された像の黒の接続した領域のみを探す第二モー
ドによりセグメント化する方法の過程(図3)を行い、 量子化された像の黒い領域の全てを自動的に前景領域と
して記録する第三モードによりセグメント化する方法の
過程(図3)を行い、 全ての画素を直接背景画素として分類する画像符号化と
しての第四モードによりセグメント化する方法の過程
(図3)を行う、ことを特徴とする請求項3に記載の方
法。 - 【請求項9】二進マスク像と最初の像を3×3の寸法の
ブロックに分割し、 各ブロックに対して、薄くした前景領域または背景領域
に属する最初の像の画素の平均値を形成し、 求めた前景と背景の画素強度を5×5平均値フィルタで
隣の画素へ広げ、 残りの画素を他の5×5平均値フィルタで満たし、一定
のグレー値が前景像に対する平均値濾波に含まれてい
る、ことを特徴とする請求項1に記載の方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19958553A DE19958553A1 (de) | 1999-12-04 | 1999-12-04 | Verfahren zur Kompression von gescannten Farb- und/oder Graustufendokumenten |
DE19958553:9 | 1999-12-04 | ||
US09/456,875 US6731800B1 (en) | 1999-12-04 | 1999-12-08 | Method for compressing scanned, colored and gray-scaled documents |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2001223903A true JP2001223903A (ja) | 2001-08-17 |
Family
ID=32826353
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000368616A Withdrawn JP2001223903A (ja) | 1999-12-04 | 2000-12-04 | 走査された色付きおよびグレースケールの文書を圧縮する方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6731800B1 (ja) |
JP (1) | JP2001223903A (ja) |
CA (1) | CA2327238A1 (ja) |
DE (1) | DE19958553A1 (ja) |
Cited By (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2003348360A (ja) * | 2002-04-25 | 2003-12-05 | Microsoft Corp | 文書エンコーディングシステム、文書デコーディングシステムおよびその方法 |
JP2005027271A (ja) * | 2003-07-01 | 2005-01-27 | Xerox Corp | 2ビットのセレクタを生成する優先されたpdlセグメント化 |
JP2005294877A (ja) * | 2003-07-01 | 2005-10-20 | Xerox Corp | ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム |
JP2005318593A (ja) * | 2004-04-30 | 2005-11-10 | Xerox Corp | より小さく圧縮された画像データ・サイズを生成するための画像データの再フォーマッティング |
JP2005323370A (ja) * | 2004-04-30 | 2005-11-17 | Microsoft Corp | マルチレベル画像の適応圧縮 |
JP2006005923A (ja) * | 2004-06-14 | 2006-01-05 | Xerox Corp | ディジタル画像のファイルサイズを動的に制御する画像入力システム及び方法 |
JP2006014331A (ja) * | 2004-06-25 | 2006-01-12 | Xerox Corp | 文書圧縮方法、文書を圧縮するためのシステム、及び画像処理装置 |
JP2007174654A (ja) * | 2005-12-21 | 2007-07-05 | Xerox Corp | 文書画像を示す走査データを処理するための方法 |
US7606417B2 (en) | 2004-08-16 | 2009-10-20 | Fotonation Vision Limited | Foreground/background segmentation in digital images with differential exposure calculations |
US7680342B2 (en) | 2004-08-16 | 2010-03-16 | Fotonation Vision Limited | Indoor/outdoor classification in digital images |
US7868922B2 (en) | 2006-02-14 | 2011-01-11 | Tessera Technologies Ireland Limited | Foreground/background segmentation in digital images |
KR101059404B1 (ko) * | 2006-05-17 | 2011-08-29 | 퀄컴 인코포레이티드 | 라인 또는 텍스트-기반 이미지 프로세싱 툴 |
US8212897B2 (en) | 2005-12-27 | 2012-07-03 | DigitalOptics Corporation Europe Limited | Digital image acquisition system with portrait mode |
US8270716B2 (en) | 2007-12-04 | 2012-09-18 | Ricoh Company, Limited | Selectively compressing picture and text areas of an image to maintain highest quality and effective compaction |
US8363908B2 (en) | 2006-05-03 | 2013-01-29 | DigitalOptics Corporation Europe Limited | Foreground / background separation in digital images |
Families Citing this family (87)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6880122B1 (en) * | 1999-05-13 | 2005-04-12 | Hewlett-Packard Development Company, L.P. | Segmenting a document into regions associated with a data type, and assigning pipelines to process such regions |
GB2358098A (en) * | 2000-01-06 | 2001-07-11 | Sharp Kk | Method of segmenting a pixelled image |
JP4189506B2 (ja) * | 2000-06-09 | 2008-12-03 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理のための装置、方法及び記録媒体 |
US6977751B1 (en) * | 2000-06-30 | 2005-12-20 | Silverbrook Research Pty Ltd | Print engine/controller to work in multiples and a printhead driven by multiple print engine/controllers |
US6901169B2 (en) | 2001-02-01 | 2005-05-31 | At & T Corp. | Method and system for classifying image elements |
JP2002369010A (ja) * | 2001-06-05 | 2002-12-20 | Nec Corp | 画像符号化装置及び画像復号装置 |
US6842541B2 (en) * | 2001-10-31 | 2005-01-11 | Xerox Corporation | Adaptive color super resolution thresholding |
US7043077B2 (en) * | 2001-11-07 | 2006-05-09 | International Business Machines Corporation | System and method for efficient compression of raster image data |
US6898316B2 (en) * | 2001-11-09 | 2005-05-24 | Arcsoft, Inc. | Multiple image area detection in a digital image |
JP4169522B2 (ja) * | 2002-03-22 | 2008-10-22 | 株式会社リコー | 画像処理装置、画像処理プログラム及びこのプログラムを記憶する記憶媒体 |
US7110596B2 (en) * | 2002-04-25 | 2006-09-19 | Microsoft Corporation | System and method facilitating document image compression utilizing a mask |
US7120297B2 (en) * | 2002-04-25 | 2006-10-10 | Microsoft Corporation | Segmented layered image system |
US7164797B2 (en) * | 2002-04-25 | 2007-01-16 | Microsoft Corporation | Clustering |
US7043079B2 (en) * | 2002-04-25 | 2006-05-09 | Microsoft Corporation | “Don't care” pixel interpolation |
US7392472B2 (en) * | 2002-04-25 | 2008-06-24 | Microsoft Corporation | Layout analysis |
US7263227B2 (en) * | 2002-04-25 | 2007-08-28 | Microsoft Corporation | Activity detector |
US7024039B2 (en) * | 2002-04-25 | 2006-04-04 | Microsoft Corporation | Block retouching |
US6941011B2 (en) * | 2002-06-27 | 2005-09-06 | Hewlett-Packard Development Company, Lp. | Method and system for image processing including mixed resolution, multi-channel color compression, transmission and decompression |
EP1530377A4 (en) * | 2002-06-28 | 2006-05-10 | Nokia Corp | INFORMATION TERMINAL |
US7356183B2 (en) * | 2002-07-01 | 2008-04-08 | Xerox Corporation | Segmentation method and system for multiple raster content (MRC) representation of documents |
US6987882B2 (en) * | 2002-07-01 | 2006-01-17 | Xerox Corporation | Separation system for Multiple Raster Content (MRC) representation of documents |
US7242802B2 (en) * | 2002-07-01 | 2007-07-10 | Xerox Corporation | Segmentation method and system for Multiple Raster Content (MRC) representation of documents |
JP2005064704A (ja) * | 2003-08-08 | 2005-03-10 | Ricoh Co Ltd | 画像処理装置、プログラム及び記憶媒体 |
US7403568B2 (en) * | 2003-08-13 | 2008-07-22 | Apple Inc. | Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using temporal filtering |
US7430335B2 (en) * | 2003-08-13 | 2008-09-30 | Apple Inc | Pre-processing method and system for data reduction of video sequences and bit rate reduction of compressed video sequences using spatial filtering |
US7561753B2 (en) * | 2004-01-09 | 2009-07-14 | The Boeing Company | System and method for comparing images with different contrast levels |
EP1555804A3 (en) * | 2004-01-19 | 2006-08-16 | Ricoh Company, Ltd. | Image processing apparatus, image processing program and storage medium |
US7379594B2 (en) * | 2004-01-28 | 2008-05-27 | Sharp Laboratories Of America, Inc. | Methods and systems for automatic detection of continuous-tone regions in document images |
US7366357B2 (en) * | 2004-02-12 | 2008-04-29 | Xerox Corporation | Systems and methods for adjusting image data to form highly compressible image planes |
US8204306B2 (en) * | 2004-06-14 | 2012-06-19 | Xerox Corporation | Method for image segmentation based on block clustering for improved processing of touching characters |
KR100643759B1 (ko) * | 2004-12-01 | 2006-11-10 | 삼성전자주식회사 | 문서 압축 장치 및 그 방법 |
EP1670257B1 (en) | 2004-12-10 | 2018-09-26 | Ricoh Company, Ltd. | Compressing a mutlivalue image with control of memory space requirement |
US7359552B2 (en) * | 2004-12-15 | 2008-04-15 | Mitsubishi Electric Research Laboratories, Inc. | Foreground detection using intrinsic images |
KR100599141B1 (ko) * | 2005-05-20 | 2006-07-12 | 삼성전자주식회사 | 문서 압축시스템 및 그 압축방법 |
JP2007306513A (ja) * | 2005-07-13 | 2007-11-22 | Konica Minolta Business Technologies Inc | 画像データの圧縮方法および装置 |
JP4533273B2 (ja) * | 2005-08-09 | 2010-09-01 | キヤノン株式会社 | 画像処理装置及び画像処理方法、プログラム |
US9247090B2 (en) * | 2005-10-20 | 2016-01-26 | Hewlett-Packard Development Company, L.P. | Printing and printers |
JP4469330B2 (ja) * | 2005-12-07 | 2010-05-26 | 株式会社リコー | 画像処理装置、画像処理方法、画像処理プログラム、記録媒体及び画像形成装置 |
US7729546B2 (en) * | 2005-12-23 | 2010-06-01 | Lexmark International, Inc. | Document segmentation for mixed raster content representation |
ATE404914T1 (de) * | 2006-02-15 | 2008-08-15 | Jaycrypto Ltd | Verfahren und vorrichtung zum erzeugen von initialwerten für einen zufallszahlengenerator |
US7889932B2 (en) * | 2006-03-02 | 2011-02-15 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US8630498B2 (en) * | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
US7792359B2 (en) * | 2006-03-02 | 2010-09-07 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
DE102006010763A1 (de) * | 2006-03-08 | 2007-09-13 | Netviewer Gmbh | Hybrides Bildkompressionsverfahren |
JP2007300601A (ja) * | 2006-04-07 | 2007-11-15 | Konica Minolta Business Technologies Inc | 画像データの圧縮方法およびその装置 |
US8019171B2 (en) | 2006-04-19 | 2011-09-13 | Microsoft Corporation | Vision-based compression |
JP4732250B2 (ja) * | 2006-06-14 | 2011-07-27 | キヤノン株式会社 | 情報処理装置、制御方法、およびコンピュータプログラム |
US7864365B2 (en) | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
US8437054B2 (en) * | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
JP4333708B2 (ja) * | 2006-08-02 | 2009-09-16 | コニカミノルタビジネステクノロジーズ株式会社 | 電子ファイルの生成においてその生成に係る入力データを処理するための方法、装置、およびコンピュータプログラム |
US7876959B2 (en) * | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
US7840071B2 (en) * | 2006-12-12 | 2010-11-23 | Seiko Epson Corporation | Method and apparatus for identifying regions of different content in an image |
US8254680B2 (en) * | 2007-01-24 | 2012-08-28 | Samsung Electronics Co., Ltd. | Apparatus and method of segmenting an image in an image coding and/or decoding system |
US7856142B2 (en) * | 2007-01-26 | 2010-12-21 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting character content in a digital image |
US8068684B2 (en) | 2007-05-04 | 2011-11-29 | I.R.I.S. | Compression of digital images of scanned documents |
US20090041344A1 (en) * | 2007-08-08 | 2009-02-12 | Richard John Campbell | Methods and Systems for Determining a Background Color in a Digital Image |
US7899248B2 (en) * | 2007-08-30 | 2011-03-01 | Seiko Epson Corporation | Fast segmentation of images |
US7936923B2 (en) * | 2007-08-31 | 2011-05-03 | Seiko Epson Corporation | Image background suppression |
US8155437B2 (en) * | 2007-09-07 | 2012-04-10 | CVISION Technologies, Inc. | Perceptually lossless color compression |
US8014596B2 (en) * | 2007-10-30 | 2011-09-06 | Sharp Laboratories Of America, Inc. | Methods and systems for background color extrapolation |
US8548251B2 (en) * | 2008-05-28 | 2013-10-01 | Apple Inc. | Defining a border for an image |
US8391638B2 (en) | 2008-06-04 | 2013-03-05 | Microsoft Corporation | Hybrid image format |
US8189917B2 (en) * | 2008-09-25 | 2012-05-29 | Sharp Laboratories Of America, Inc. | Methods and systems for locating text in a digital image |
US8594466B2 (en) * | 2008-11-11 | 2013-11-26 | Sharp Kabushiki Kaisha | Image data converting device, method for converting image data, program and storage medium |
US9521994B2 (en) * | 2009-05-11 | 2016-12-20 | Siemens Healthcare Gmbh | System and method for image guided prostate cancer needle biopsy |
JP5413080B2 (ja) * | 2009-09-15 | 2014-02-12 | 株式会社リコー | 画像処理装置及び画像処理方法 |
KR101710883B1 (ko) * | 2009-11-04 | 2017-02-28 | 삼성전자주식회사 | 필터 정보를 이용한 영상 압축 장치 및 방법과 영상 복원 장치 및 방법 |
KR101058726B1 (ko) * | 2009-11-11 | 2011-08-22 | 삼성전자주식회사 | 조명 성분을 제거하기 위한 이미지 보정 장치 및 방법 |
US8000528B2 (en) * | 2009-12-29 | 2011-08-16 | Konica Minolta Systems Laboratory, Inc. | Method and apparatus for authenticating printed documents using multi-level image comparison based on document characteristics |
US8340363B2 (en) | 2010-05-27 | 2012-12-25 | Palo Alto Research Center Incorporated | System and method for efficient interpretation of images in terms of objects and their parts |
US8582834B2 (en) | 2010-08-30 | 2013-11-12 | Apple Inc. | Multi-image face-based image processing |
US8760464B2 (en) | 2011-02-16 | 2014-06-24 | Apple Inc. | Shape masks |
US8331670B2 (en) * | 2011-03-22 | 2012-12-11 | Konica Minolta Laboratory U.S.A., Inc. | Method of detection document alteration by comparing characters using shape features of characters |
US8457426B1 (en) | 2011-05-18 | 2013-06-04 | Adobe Systems Incorporated | Method and apparatus for compressing a document using pixel variation information |
US8699815B2 (en) * | 2011-05-31 | 2014-04-15 | Adobe Systems Incorporated | Methods and apparatus for improved display of foreground elements |
BE1022166B1 (fr) * | 2014-12-23 | 2016-02-23 | I.R.I.S. | Procede de compression d'images |
US10303498B2 (en) | 2015-10-01 | 2019-05-28 | Microsoft Technology Licensing, Llc | Performance optimizations for emulators |
CN105550633B (zh) * | 2015-10-30 | 2018-12-11 | 小米科技有限责任公司 | 区域识别方法及装置 |
JP2017184197A (ja) * | 2016-03-31 | 2017-10-05 | 船井電機株式会社 | 印刷装置 |
CN108229344A (zh) * | 2017-12-19 | 2018-06-29 | 深圳市商汤科技有限公司 | 图像处理方法和装置、电子设备、计算机程序和存储介质 |
CN109960789B (zh) * | 2017-12-22 | 2023-01-24 | 广州帷策智能科技有限公司 | 基于自然语言处理的人物关系分析方法 |
WO2019133986A1 (en) * | 2017-12-30 | 2019-07-04 | Wu Yecheng | Printing white features of an image using a print device |
CN110365929B (zh) * | 2018-04-10 | 2021-01-05 | 北京仁光科技有限公司 | 信息传输方法、装置、设备、系统及存储介质 |
US11403100B2 (en) | 2020-08-31 | 2022-08-02 | Microsoft Technology Licensing, Llc | Dual architecture function pointers having consistent reference addresses |
US11042422B1 (en) | 2020-08-31 | 2021-06-22 | Microsoft Technology Licensing, Llc | Hybrid binaries supporting code stream folding |
US11231918B1 (en) | 2020-08-31 | 2022-01-25 | Microsoft Technologly Licensing, LLC | Native emulation compatible application binary interface for supporting emulation of foreign code |
CN114915788B (zh) * | 2022-07-19 | 2022-09-13 | 中科金勃信(山东)科技有限公司 | 一种用于档案的图像压缩方法、系统及介质 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4916744A (en) | 1985-12-10 | 1990-04-10 | Fuji Photo Film Co., Ltd. | Image signal processing method |
US4924521A (en) | 1987-12-18 | 1990-05-08 | International Business Machines Corporation | Image processing system and method employing combined black and white and gray scale image data |
US4873577A (en) | 1988-01-22 | 1989-10-10 | American Telephone And Telegraph Company | Edge decomposition for the transmission of high resolution facsimile images |
JPH02177766A (ja) | 1988-12-28 | 1990-07-10 | Canon Inc | 2値画像の階層的符号化方式 |
GB9006080D0 (en) | 1990-03-17 | 1990-05-16 | Int Computers Ltd | Progressive encoding |
ATE185211T1 (de) | 1995-01-31 | 1999-10-15 | United Parcel Service Inc | Verfahren und gerät zum trennen des vordergrunds und hintergrunds in textenthaltenden bildern |
US5778092A (en) | 1996-12-20 | 1998-07-07 | Xerox Corporation | Method and apparatus for compressing color or gray scale documents |
-
1999
- 1999-12-04 DE DE19958553A patent/DE19958553A1/de not_active Withdrawn
- 1999-12-08 US US09/456,875 patent/US6731800B1/en not_active Expired - Lifetime
-
2000
- 2000-12-01 CA CA002327238A patent/CA2327238A1/en not_active Abandoned
- 2000-12-04 JP JP2000368616A patent/JP2001223903A/ja not_active Withdrawn
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100937542B1 (ko) | 2002-04-25 | 2010-01-19 | 마이크로소프트 코포레이션 | 세그먼트된 계층화 이미지 시스템 |
JP2003348360A (ja) * | 2002-04-25 | 2003-12-05 | Microsoft Corp | 文書エンコーディングシステム、文書デコーディングシステムおよびその方法 |
JP2005027271A (ja) * | 2003-07-01 | 2005-01-27 | Xerox Corp | 2ビットのセレクタを生成する優先されたpdlセグメント化 |
JP2005294877A (ja) * | 2003-07-01 | 2005-10-20 | Xerox Corp | ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム |
JP2010239651A (ja) * | 2003-07-01 | 2010-10-21 | Xerox Corp | ドキュメントのマルチラスタコンテンツ(mrc)表現についてのセグメント化方法及びシステム |
US8620071B2 (en) | 2004-04-30 | 2013-12-31 | Neiversan Networks Co. Llc | Adaptive compression of multi-level images |
JP2005323370A (ja) * | 2004-04-30 | 2005-11-17 | Microsoft Corp | マルチレベル画像の適応圧縮 |
JP2005318593A (ja) * | 2004-04-30 | 2005-11-10 | Xerox Corp | より小さく圧縮された画像データ・サイズを生成するための画像データの再フォーマッティング |
US7991238B2 (en) | 2004-04-30 | 2011-08-02 | Neiversan Networks Co. Llc | Adaptive compression of multi-level images |
US8351694B2 (en) | 2004-04-30 | 2013-01-08 | Neiversan Networks Co. Llc | Adaptive compression of multi-level images |
JP2006005923A (ja) * | 2004-06-14 | 2006-01-05 | Xerox Corp | ディジタル画像のファイルサイズを動的に制御する画像入力システム及び方法 |
JP2006014331A (ja) * | 2004-06-25 | 2006-01-12 | Xerox Corp | 文書圧縮方法、文書を圧縮するためのシステム、及び画像処理装置 |
US7606417B2 (en) | 2004-08-16 | 2009-10-20 | Fotonation Vision Limited | Foreground/background segmentation in digital images with differential exposure calculations |
US7680342B2 (en) | 2004-08-16 | 2010-03-16 | Fotonation Vision Limited | Indoor/outdoor classification in digital images |
US7912285B2 (en) * | 2004-08-16 | 2011-03-22 | Tessera Technologies Ireland Limited | Foreground/background segmentation in digital images with differential exposure calculations |
US7957597B2 (en) | 2004-08-16 | 2011-06-07 | Tessera Technologies Ireland Limited | Foreground/background segmentation in digital images |
US8175385B2 (en) | 2004-08-16 | 2012-05-08 | DigitalOptics Corporation Europe Limited | Foreground/background segmentation in digital images with differential exposure calculations |
JP2007174654A (ja) * | 2005-12-21 | 2007-07-05 | Xerox Corp | 文書画像を示す走査データを処理するための方法 |
US8212897B2 (en) | 2005-12-27 | 2012-07-03 | DigitalOptics Corporation Europe Limited | Digital image acquisition system with portrait mode |
US7868922B2 (en) | 2006-02-14 | 2011-01-11 | Tessera Technologies Ireland Limited | Foreground/background segmentation in digital images |
US8363908B2 (en) | 2006-05-03 | 2013-01-29 | DigitalOptics Corporation Europe Limited | Foreground / background separation in digital images |
US8306336B2 (en) | 2006-05-17 | 2012-11-06 | Qualcomm Incorporated | Line or text-based image processing tools |
KR101059404B1 (ko) * | 2006-05-17 | 2011-08-29 | 퀄컴 인코포레이티드 | 라인 또는 텍스트-기반 이미지 프로세싱 툴 |
US8270716B2 (en) | 2007-12-04 | 2012-09-18 | Ricoh Company, Limited | Selectively compressing picture and text areas of an image to maintain highest quality and effective compaction |
Also Published As
Publication number | Publication date |
---|---|
US6731800B1 (en) | 2004-05-04 |
CA2327238A1 (en) | 2001-06-04 |
DE19958553A1 (de) | 2001-06-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2001223903A (ja) | 走査された色付きおよびグレースケールの文書を圧縮する方法 | |
US7184589B2 (en) | Image compression apparatus | |
US5539842A (en) | Method and apparatus for compressing and decompressing images of documents | |
JP4667062B2 (ja) | 画像解析装置、画像解析方法、及びブロブ識別装置 | |
US6157736A (en) | Method and apparatus for automatic image segmentation using template matching filters | |
US6556711B2 (en) | Image processing apparatus and method | |
JP2531840B2 (ja) | 2進テキスト画像の高品質圧縮法 | |
US7782339B1 (en) | Method and apparatus for generating masks for a multi-layer image decomposition | |
JP4423298B2 (ja) | デジタル画像におけるテキスト状エッジの強調 | |
US7634150B2 (en) | Removing ringing and blocking artifacts from JPEG compressed document images | |
US7324120B2 (en) | Segmentation method and system for scanned documents | |
US20030202697A1 (en) | Segmented layered image system | |
US8452112B2 (en) | Image encoding apparatus and method of controlling the same | |
US20090141048A1 (en) | Method, apparatus, and computer program product for processing image | |
JP2010527190A (ja) | スキャンされたドキュメントを含むデジタル画像の圧縮 | |
KR100742798B1 (ko) | 화상 데이터 처리 장치 | |
JPH07121656A (ja) | 画像像域分離装置 | |
JP2008524728A (ja) | デジタル画像をセグメント化する方法及びコンパクトな表現の生成方法 | |
US8774511B2 (en) | Image processing apparatus and image processing method | |
JP3596863B2 (ja) | 画像圧縮装置および画像伸張装置、ならびに画像圧縮方法および画像伸張方法をコンピュータに実行させるためのプログラムをそれぞれ記録したコンピュータ読取可能な記録媒体 | |
JP2004537220A (ja) | ディジタル画像を処理する装置 | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
EP1006714A2 (en) | Method of processing mixed raster content planes | |
Barthel et al. | New technology for raster document image compression | |
Gormish | Compression of palettized images by color |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A300 | Application deemed to be withdrawn because no request for examination was validly filed |
Free format text: JAPANESE INTERMEDIATE CODE: A300 Effective date: 20080205 |