JP3828212B2 - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP3828212B2 JP3828212B2 JP27525596A JP27525596A JP3828212B2 JP 3828212 B2 JP3828212 B2 JP 3828212B2 JP 27525596 A JP27525596 A JP 27525596A JP 27525596 A JP27525596 A JP 27525596A JP 3828212 B2 JP3828212 B2 JP 3828212B2
- Authority
- JP
- Japan
- Prior art keywords
- black
- image
- text
- black text
- text item
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 72
- 230000015654 memory Effects 0.000 claims description 86
- 238000000034 method Methods 0.000 claims description 34
- 238000009826 distribution Methods 0.000 claims description 33
- 238000004458 analytical method Methods 0.000 claims description 20
- 238000012544 monitoring process Methods 0.000 claims description 14
- 230000008569 process Effects 0.000 claims description 9
- 230000004044 response Effects 0.000 claims description 2
- 230000002708 enhancing effect Effects 0.000 claims 1
- 238000010586 diagram Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 10
- 230000004075 alteration Effects 0.000 description 5
- 230000008901 benefit Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 239000003086 colorant Substances 0.000 description 4
- 238000003672 processing method Methods 0.000 description 4
- 238000003707 image sharpening Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 239000000470 constituent Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/46—Colour picture communication systems
- H04N1/56—Processing of colour picture signals
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Color Image Communication Systems (AREA)
- Dot-Matrix Printers And Others (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、画像表現においてテキスト表示を強調するようにカラーまたは白黒データを処理する画像処理装置および方法に関するもので、特に、カラー・スキャナ、プリンタ、複写機、ファクシミリなどにおいて使用されるためのそのような装置および方法に関するものである。
【0002】
【従来の技術】
従来技術の設計による多くのカラー複写機において、オリジナルの画像が走査されデジタル化され、走査された画像の各ピクセルにおけるレッド、グリーン、ブルーの3色の相対的強度を表すRGBデジタル信号が生成される(RGBはレッド、グリーン、ブルーの頭文字をとったもので上記3色を表す)。RGBデータはカラー処理パイプラインによってシアン、マジェンタ、イエローおよびブラックのCMYK信号に変換され(CMYKは同様に上記4色を表す)、このCMYK信号が印刷される画像の該当するピクセルに置かれるシアン、マジェンタ、イエローおびブラックのインクまたはトナーの量を制御するために使用される。カラー処理パイプラインは、連続階調カラー画像データを適切に取り扱う能力を持つが、例えば白または単色の背景上の単純なテキストを処理するような場合、テキスト領域に関しては必ずしもうまく処理できるとはいえない。スキャナの不正確さのみならず、連続階調についてほぼ白色背景領域を白色にするように求められるRGBとCMYKの間のカラー対応付けの非線形性のため、テキストは過度に明かるくなり、テキスト内およびその周辺におけるカラーの強度が強くなる傾向がある。カラー背景上のカラー・テキストまたは黒色テキストに対する逆作用はさほど重大でないと認められる。同様の問題が、画像が色彩信号(すなわちchromatic signal)の集合として表現されるレーザ・プリンタ、インクジェット・カラー・プリンタ、カラー・ディスプレイ、カラー・スキャナ等コピア以外の装置についても発生する。
【0003】
米国特許第5,189,523号は、例えば稜線フィルタおよび「黒の判断(black judgement」処理段階を使用して画像の最初の走査において識別信号を作成するシステムを開示している。識別データは、ビットマップ・メモリに記憶され、第2の走査の間、第2の走査のデータを強調すべきかそのまま使用すべきかを制御するために使用される。ヨーロッパ特許出願第463,844号は、テキスト文字または項目と背景の間の境界領域を強調するように入力画像が処理されるシステムを開示している。上記両システムは、黒と白の間の稜線またはインターフェースに焦点を当て、画像コンポーネント内の特性または連結性を考慮していないため、場合によっては、形式全体の劣化という犠牲を払いながらテキスト・グリフ(glyph、字形の意)の稜線を強調する。
【0004】
【発明が解決しようとする課題】
上記従来技術の問題点を克服し、白たは単色の背景を持つテキスト文字またはテキスト項目を強調表現する画像処理装置および方法が求められる。
【0005】
【課題を解決するための手段】
本発明は、テキスト強調のための改善された装置および方法を提供する。この装置および方法において、潜在的なテキスト項目または字形(すなわちグリフ、glyph)が境界を形成する物理的領域が判別され、その領域内のカラー・データを監視して黒色テキスト項目を識別する。
【0006】
本発明は、1つの側面において、カラーまたは白黒画像を表現するカラー信号を処理して上記画像の後続の表現において黒色テキスト表示を強調する画像処理装置を提供する。該装置は、
(i)画像またはその一部の範囲内において各々が潜在的テキスト項目を定義する複数の隣接ピクセルからなる1つまたは複数のグループを特定するため、該画像またはその一部に関する上記カラー信号の少なくとも1つを分析する手段、
(ii)各潜在的なテキスト項目の範囲内およびその周辺におけるピクセルのカラー信号の少くともいくつかを監視して、1つまたは複数の黒色テキスト項目を識別するカラー識別手段、および
(iii)上記画像の後続の表現において、上記1つまたは複数の識別された黒色テキスト項目を強調する手段、
を備える。便宜上、上記「黒色テキスト項目」という用語は、黒色テキスト項目、ほぼ黒色のテキスト項目、あるいは、黒い背景上の白い前景を含むその他の前景テキスト項目を定義するために使用される。
【0007】
好ましくは、上記分析手段が、各ピクセルにおける上記カラー信号の強度を第1のしきい値と比較し、上記第1のしきい値以下の強度を持つピクセルの各々を潜在的なテキスト項目に属するものとして分類し、上記装置が、潜在的なテキスト項目およびそれに属するピクセルを特定するデータを記憶する手段を含む。
【0008】
カラー信号は通常のレッド、グリーンおよびブルーのカラー信号を含むが、上記分析手段は、好ましくは、グリーン信号を分析する。
【0009】
上記カラー識別手段は、好ましくは、潜在的テキスト項目を構成するピクセルの各々のレッド、グリーンおよびブルーの強度を監視する。好ましい実施形態においては、上記カラー識別手段は、各カラー・チャネル毎に、各カラー・チャネルに関する推定値を表す値を累計する手段を含む。
【0010】
上記強調手段は、好ましくは、識別された黒色テキスト項目の各々の範囲内のピクセルの各々を黒に設定する。上記カラー信号の強度が上記第1のしきい値より低い第2のしきい値以下のピクセルのみを上記強調手段が黒に設定するように本発明の上記装置を構成することに利点がある。好ましくは、上記強調手段は、上記識別された黒色テキスト項目に隣接する選択されたピクセルのカラー信号を、白または別の適切な色に設定する手段を含む。
【0011】
上記装置は、好ましくは、画像を潜在的なテキスト領域と非テキスト領域に分類する手段を含み、このため、上記分析手段がテキスト領域だけのカラー信号を分析することが可能となる。上記分類手段は、好ましくは、上記画像内の選択されたセルまたは領域を定義する手段、各セルまたは領域内において選択されたピクセルに関するカラー信号の値を監視し上記選択されたピクセルに関するカラー信号の強度の統計的度数分布を表すデータを決定する手段、および上記統計的度数分布に従って、上記選択された領域をテキスト領域または非テキスト領域として特定する手段を含む。上記監視手段は、各チャネルに関する統計的度数分布データにおける頂点を判断することを含む。
【0012】
上記特定手段は、好ましくは、上記統計的度数分布データを黒色強度最大しきい値および白色強度最小しきい値と比較する手段を含み、この場合、上記白色強度最小値は、純白およびオフホワイト背景を捕捉するために必要なものとして設定されるものである。選択された領域が上記黒色強度最大しきい値と上記白色強度最小しきい値の間で頂点を含まず、下記条件のいずれかまたは両方を満たしていれば、選択された領域はテキスト領域と特定される。すなわち、
(i)選択された領域が白色最小しきい値より大きい頂点を含むこと、
(ii)選択された領域が黒色最大しきい値より小さい頂点を含むこと。
【0013】
上記の技術は、白色上の黒色または黒色上の白色を意味する。更に一層一般的カラー識別のため、1つの実施形態において、(8ビットRGBの場合合計2563という)可能なトリプレットの組合せのそれぞれを検討することを避けるため、本発明の上記装置は、各カラー信号毎に別々に強度の統計的度数分布データを決定する手段、各カラー信号毎に統計的度数分布データにおける頂点を識別する手段、上記頂点に関する強度値を用いて定義され、上記頂点に対応する制約探索空間を選択する手段、上記探索空間のそれぞれにおける母集団を評価する手段を含み、その結果、黒または黒に近い色を構成するカラー信号の組み合わせに対応する1つの密度の濃い探索空間、および白色、白に近い色または淡い有色背景を構成するカラー信号に対応する別の密度の濃い探索空間が存在すれば、当該選択された領域はテキスト領域であると認定される。処理に必要なメモリのサイズを減らし、処理されたカラー信号の出力を開始する前に完全な画像またはページを記憶しなければならない必要性をなくすため、本発明の上記装置は、好ましくは、画像データをスライド式ウィンドウまたは帯状メモリとして記憶する手段を含み、上記分析手段および上記カラー識別手段がこのスライド式ウィンドウまたは帯状メモリに対して動作するように構成される。
【0014】
別の1面において、本発明は、カラーまたは白黒画像を表現するカラー信号を処理して、引き続く処理における上記画像の表現において黒色テキストの表示を強調する画像処理方法を提供する。該方法は、
(i)画像またはその一部の範囲内において各々が潜在的テキスト項目を定義する複数の隣接ピクセルからなる1つまたは複数のグループを特定するため、該画像またはその一部に関する上記カラー信号の少なくとも1つを分析するステップ、
(ii)各潜在的なテキスト項目の範囲内およびその周辺におけるピクセルのカラー信号の少くともいくつかを監視して、黒色テキスト項目を識別するステップ、および
(iii)上記引き続く処理における上記画像の表現において上記識別された黒色テキスト項目を強調するステップ、
を含む。
【0015】
本発明は、また、画像処理のための装置および方法を更に拡張して、上記画像の選択された領域内の複数のピクセルのカラー信号の少くともいくつかの強度を監視し、上記監視された強度を使用して各カラー信号の強度度数分布データを決定し、それにより上記選択された領域をテキスト領域と非テキスト領域に分類する。
【0016】
上述の本発明は、上述の機能および後述の実施形態のどのような組み合わせに対しても拡張することが可能である。本発明の上記装置は、好ましくは、上記画像を鮮明にする機能を持つ鮮明化フィルタのような手段を含む。
【0017】
【発明の実施の形態】
システム概要
本実施形態において、本発明の装置は、典型的にはテキストおよび非テキスト領域を含む可能性のあるカラー画像(例えばテキストが散在し、いくつかの写真を含むページ)を表現するRGBデジタルのカラー信号を受け取る。例えばカラー・インクジェット印刷エンジンによって画像がレンダリングされる場合、上記のような装置において通常観察される(黒色テキスト項目の褪色化および稜線の劣化のような)有害な欠陥が減少または回避されるようにカラー信号が処理される。
【0018】
本実施形態においては、図1に示される処理ステップが適用される。典型的にはカラー・チャネル当たり8ビットのRGBデータが、スキャナのような入力装置10から受け取られ、テキストおよび非テキスト両方の品質を向上させるため初期的に鮮明化フィルタにかけられる。
【0019】
次に、画像は、純白または淡色の背景上の黒色テキストと思われる領域とそうでない領域に大まかに細分化される(ブロック14)。このステップは「ページ分析」と呼ばれ、細分化された領域は、「テキスト領域」および「非テキスト領域」と呼ばれる。次に、テキスト領域は、テキスト字形、分解されたテキスト字形、句読点などのような個々の黒色テキスト項目の各々を強調のため特定するように処理される。
【0020】
テキスト領域の予備的特定作業によって、処理全体のロードおよび処理時間が大幅に減少し、強化処理の結果生じる非テキスト領域中の望ましくない人的加工を相当程度防止することができる。非テキスト領域および連続階調領域の表現は、特別の強調を必要としないし、それによる利益もないと本発明は認識する。
【0021】
テキスト領域のすべての黒色テキスト・コンポーネントを特定した後、それらのコンポーネントを強調するため、該コンポーネントを形成するピクセルのRGB値を黒に設定し、当該項目を取り囲むピクセルの背光を、白またはあらかじめ設定された明るい背景色に設定することによって、褪色のない、明瞭な稜線を持った黒色テキスト項目が提供される(ブロック18)。最後に、処理されたデータは、印刷、記憶またはその他の用途のためRGBデータを4ビットCYMKデータに変換するカラー・パイプラインを含むであろう出力装置20へ供給される。
【0022】
図2ないし図4を参照して説明すれば、出力を開始する前にページ全体をメモリに読み取る必要性を取り除くため、本発明の実施形態は、処理の進行にともなって、ページ幅を持つ循環画像バッファまたは「帯状メモリ」が仮想画像を移動させる処理技術を実施し、画像のスライド式ウィンドウが処理される(図2参照)。帯状メモリの高さは、帯状メモリによってカバーされる画像の走査行数を規定し、帯状メモリのステップ・サイズは、帯状メモリが各繰返し(すなわち処理ステップ)においてどれだけ移動されるべきかを規定する。底部ステップが最終的には最上部ステップになるように、帯状メモリの高さはステップ幅の倍数でなければならない。底部および最上部バッファは、スキャナまたはその他の装置のバッファ・メモリと上方互換性がある入出力バッファとみなされる。
【0023】
帯状メモリが仮想画像上を移動するにつれ、帯状メモリの底部において新しいデータが入力ステップに読み込まれ、処理されたデータが最上部において出力ステップへ書き込まれる。このように、ピクセル・アドレスは、基礎をなす仮想画像ではなくむしろ帯状メモリに対して指定される。従って、帯状メモリが画像に対して移動する度毎に、帯状メモリに関してステップ・サイズ(すなわち行の集合)の倍数でなければならない固定的隣接部分にプロセスを適用する効果は、画像の異なる行集合に作用する効果を持つ。帯状メモリに基づくアプローチは、プロセスのパイプライン化を可能にし、関連履歴を維持し、領域処理の実行を可能にする。図3に示されるように、効率化を図るため、帯状メモリ9はインデックス・テーブル11を介してアクセスされる。上記インデックス・メモリの各エレメントは、帯状メモリの単一のデータ行をアドレス指定する。帯状メモリが移動する時、処理のため更にデータ行を選択する場合であろうと新しいデータ行を記憶する場合であろうと、帯状メモリ・インデックスの行アドレスのみが取り扱われ、帯状メモリのデータは取り扱われない。
【0024】
このように、帯状メモリが画像に沿って移動する毎に、インデックス11において、各行アドレスがその1ステップに相当するサイズだけ下方の以前の行アドレスによって置き換えられる(当然ではあるが、以前にインデックス・テーブルの上部の以前のアドレスによって置き換えられる底部のアドレスの場合は例外である)。
【0025】
画像処理技術の帯状メモリに基づく本発明の実施形態が図4に示されている。3つのデータ帯状メモリが使用される。それらには、小さい入力帯状メモリ22ならびに入力帯状メモリ22から鮮明化された画像を受け取り黒色テキスト強調を実行するための大きい画像帯状メモリ24といういずれもピクセルRGB当たり24ビットの2つの帯状メモリが含まれる。次に、画像帯状メモリ24は、画像のピクセルに関する状況情報を維持し、画像帯状メモリ24と密に連係する8ビット幅状態帯状メモリ26を使用する。処理、同期化およびデータ・パイプライン化はプロセッサ28によって実行され制御される。
【0026】
入力装置10からの画像データが入力帯状メモリ22の底部へ読み取られ、画像鮮明化処理が入力帯状メモリの中心領域に適用され(詳細は後述)、結果が画像帯状メモリ24の底部に書き込まれる。画像帯状メモリ24の底部30は、RGB度数分布化ページ分析技術による処理に提供され(詳細は後述)、上位部分32は黒色テキスト識別および強調の使用に供される(詳細は後述)。画像帯状メモリ24の上端において、ピクセルに関するRGBデータが、状態帯状メモリ26において生成され記憶された状態情報に従って更新され、強調されたページが出力される(ブロック20)。
【0027】
本例における強調の動作は、黒色にするように設定された状態帯状メモリ26の状態ピクセルを持つ場合RGB値を黒色(すなわち0、0、0)に設定し、状態帯状メモリにおける状態ピクセルのRGB値が背光の一部であると識別された場合はRGB値を白色(すなわち255、255、255)に設定する動作を含む。画像および状態帯状メモリ24、26において黒色コンポーネント識別の開始と最終的強調の間の動作を分離することによって、累計されるコンポーネント統計がコンポーネントの高さを決定し、従って、本発明の方法の確かさが保証される。
【0028】
画像鮮明化
入力帯状メモリ22におけるピクセル・データは、画像の高周波コンポーネントを目立たせてテキストおよび他の項目の稜線をより鮮明にかつより暗くすることによって、鮮明化される。本実施形態において、この鮮明化は、 先ず、5×5ブロック平均空間画像フィルタ(図4参照)を画像のRGBチャネルの各々に適用して画像の低域部を取り出し、この低域部をオリジナル画像から差し引いて高域部画像(すなわち高域=オリジナル−低域)を生成することによって、実行される。次に、オリジナル画像を高域部で加重し、すなわち高域加重画像=オリジナル+A(高域比率)が得られる。
【0029】
ページ分析
ページ分析は、ページをテキストまたは非テキスト領域に分離する。広義には、これは、画像の範囲内において多数のあらかじめセットされた「セル」の各々の中の各ピクセルのRGB強度を監視して、セルのピクセルが大部分背景にあって、比較的小さい割合だけが前景にあるか否かを判断することによって行われる。この基準を満たすセルは、テキスト領域として分類される。図6の左側にはテキストと非テキスト(画像)の混合を含むページ表現が例示されていて、右側には、そのページがテキストと非テキスト領域に分類されたものが示されている。
【0030】
ページ分析は、詳細には、少なくとも2つの段階で実行される。第1に、ページは、セルのアレイに分割され、個々のセルはRGB度数分布(詳細は後述)に基づいて分析され、初期的にテキスト領域または非テキスト領域に分類される。
【0031】
ページ分析の1つの形態において、各セルに関して黒色テキストを識別するため、各RGBカラー・チャネル毎に1次元度数分布が構築され、カラー強度をそのセルにおける発生頻度に関連づける。メモリおよび処理ロードを減少させ解釈の確実性を増加させるため、(8ビット・カラー信号について0から256までの)全般的強度範囲は64ビンの1つに量子化される。
【0032】
図7に示されるように、本実施形態においてセルがテキスト領域と識別されるためには、3つのカラー・チャネルすべてが、下記4つのしきい値パラメータを用いて黒色テキスト度数分布検査を通らなければならない。
*黒色強度しきい値:黒色テキスト・ピクセルに関する最大値
*白色強度しきい値:白色テキスト・ピクセルに関する最小値
*ゼロ度数分布しきい値:予測される基準線度数分布活動性
*背景度数分布しきい値:白色強度しきい値より上方の度数分布区域。
テキスト領域、すなわち、白または淡く着色した背景上の黒色テキストを含む領域は、各カラー・チャネル毎に、黒色強度しきい値と白色強度しきい値の間で、各度数分布ビンに関する活動性がゼロ度数分布しきい値以下で、白色強度しきい値より上方の度数分布ビンに累計される活動性が背景度数分布強度しきい値より上にあるものと定義される。
【0033】
カラー・チャネル度数分布の各々において個々の頂点に対してテキスト判定を行うテキスト検査に基づく代わりに、明白なコントラストをなすカラーとともに白と黒を識別する代替技術において、最も普遍的に発生する(R、G、B)トリプレットを検出するため、セルを3次元(R、G、B)度数分布における頂点の識別に基づいて、分類することも可能である。この場合、次に頂点が検証され、(例えばすべての8ビット・チャネルが160より大きい強度を持つ場合)非常に明るい支配的頂点が存在し、たぶん強度のより小さい暗い頂点が存在する場合、そのセルはテキスト・セルと分類され、そうでなければ、セルは非テキスト・セルと分類される。計算負荷を減少するため、(全部で224ある)R、G、Bトリプレットのすべての可能な組み合わせの頻度を調べる代わりに、各チャネル毎の度数分布が分析され、頂点識別プロセスが続く。このように、各1次元チャネル度数分布の頂点は、各頂点にそれらの序数の値に基づくインデックスを割り当てることによって識別される。3次元の場合、これらのインデックスは、可能な頂点を表現する3次元空間における制約された探索空間立方体を定義する。立方体中のトリプレット値が再び取り出され、最も普遍的に発生するトリプレットを識別するため各立方体に対応する値が累計される。各ピクセル毎にそれがどの3次元頂点に属するかを検査する実際の計算コストは、計算的にもメモリ的にも非常に小さい。一般的には、テキストは、白または背景に対応する高密度立方体および黒に対応する高密度立方体を有するが、その他の高密度立方体を持たない。ページ分析の結果、画像は潜在的なテキスト領域および非テキスト領域に分解される。
【0034】
黒色テキスト強調
要約すれば、鮮明化された画像データは、RGB帯状メモリ24の底部に入力され、グリーン・チャネルにおける各行のピクセルに対してしきい値の評価を行い、潜在的なテキスト・コンポーネントを構成するピクセルが識別され、状態帯状メモリ26の底部における対応する状態ピクセルが初期的に作成される。潜在的なテキスト・コンポーネントを構築するためプロセッサ28によって連結コンポーネント分析が適用される。次に、潜在的なテキスト・コンポーネントを構成するピクセルのRGB統計がプロセッサ28によって分析され、潜在的なテキスト・コンポーネントが黒色かあるいはほぼ黒色かが判定され、そうであればそのコンポーネントは強調対象として選択される。強調動作は、構成状態ピクセルを黒色に設定し、隣接する状態ピクセルの背光を白色に設定することからなる。この背光は、コンポーネント・ピクセルの解釈が定常状態になると、状態帯状メモリの最上部で識別される。最後に、画像帯状メモリ24の最上部で、状態情報を使用して対応するRGB帯状メモリのピクセルが更新され、強調されたページが出力される(ブロック20)。
【0035】
潜在的な黒色テキスト・コンポーネントの初期段階の識別は、グリーン・チャネル(G)のみの強度識別に基づき、次の2つのしきい値が使用される。
T1:補佐コンポーネント・ピクセルを識別する
T2:黒色コンポーネント・ピクセルを識別する。
但し、T1>T2であり、すなわち、補佐コンポーネント・ピクセルを識別するしきい値は黒色コンポーネント・ピクセルを識別するものより「明るい」。
【0036】
図8および図9に示されるように、2つのしきい値の使用には2つの重要な利点がある。生の画像がボケまたは消えたテキスト輪郭を持つ可能性があることを所与とすれば、2つのしきい値の使用によって、細分化された黒色テキスト・コンポーネントを接合し、最終的な文字厚に影響を及ぼすことなく一層強力なカラー推定値を収集することができる柔軟性が与えられる。また、2つのしきい値の使用によって、2つのしきい値の間の強度を持つ「補佐的ピクセル」の識別も可能となり、それによって、ページの部分がテキスト・コンポーネントなのか画像なのかまたはぎざぎざ模様なのかを識別することができるという利点がある。黒色テキスト・コンポーネントが持つ補佐ピクセルは相対的に少ないが、(黒色コンポーネントしきい値である)T1より以下の画像またはぎざぎざ模様の部分は相対的に大きい補佐隣接ピクセルを持つ傾向がある(図8の(c)参照)。
【0037】
図8に示されるように、図8の(a)のテキスト字形が走査処理の間に(b)の格子に量子化されると、しきい値T1、T2以下のピクセルが(c)のように示されるであろう。仮にT1のみを用いれば、テキストの表現は重くなりすぎるであろうし、しきい値T2のみであれば、コンポーネントは分割され(例えば左下部分)、比較的小さい部分が大きい部分にかくされてしまうのでその識別が弱くなる結果となろう。2つのしきい値アプローチの使用は、黒色テキスト字形識別を黒色ピクセル強調から分離する。
【0038】
図9において、(a)のグリーン・チャネル無階調画像領域に関する2つのしきい値以下のピクセルが(b)に示されている。黒色に設定できるほどの暗さを持つしきい値T2以下のグリーン・ピクセルが存在するが、(T1以下の)コンポーネントを定義する関連補佐ピクセルが支配的である。2つのしきい値の使用が、無階調画像をテキスト(またはその他の単調)コンポーネントと区別するのに役立つ。
【0039】
RGBデータは、行から行へ処理され、2つのしきい値T1、T2の各々に関するピクセルの状態が状態帯状メモリ26において明示される。状態帯状メモリの各バイト内において、上位4ビットのうちの2ビットが(後述される)連結コンポーネント成長アルゴリズムによって使用され、下位4ビットがピクセルの現在時黒色テキスト状態を記述する。図10は、黒色テキスト状態フィールドがどのように制約されるかを示す。バイトは全体として黒色状態を示すと見なされるが、以下のように限られたセットの値だけが実際には許容される。
*黒色状態が0であれば、これは非テキスト・クセルである、
*白色ビットが設定されていれば、コンポーネント強調段階の間にこのピクセを白色に設定する、
*コンポーネント・ビットまたは黒色ビットが設定されていれば、このピクセルは、黒色コンポーネント形成しきい値を満たす、
*黒色ビットが設定されていれば、コンポーネント強調段階の間にこのピクセルを黒色に設定する。
重要な値は次の表1の通りである。
【0040】
【表1】
B C W T2
0 0 0 0 0 設定されない NOT_SET
0 0 1 0 2 白色背光ピクセルを白色に設定 WHITE
0 1 0 0 4 しきい値T1未満 T1_COMPONENT
0 1 0 1 5 しきい値T2未満 T2_COMPONENT
1 0 0 0 8 テキスト・ピクセルを黒色に設定 BLACK
【0041】
しきい値使用の結果、状態ピクセルは、NOT_SET、T1_COMPONENTまたは T2_COMPONENTという値のうちの1つを割り当てられる。T1_COMPONENTまたは T2_COMPONENTに設定された黒色状態ピクセルを持つ(すなわち黒色状態フィールドのコンポーネント・ビットが設定されている)連結状態ピクセルについて収集されるRGB統計は、黒色テキスト項目識別の基礎を形成する。ピクセルの連結性を決定するための画像処理方法が種々公開されている。本実施形態では、連結性は8個の隣接に基づいて定義される。あるピクセル・ペアが格子の中で斜めを含む隣接関係で隣接していればそれら2つは8個の隣接関係において連結していると見なされる(図11参照)。従って、2つのピクセルは、8個の隣接経路がそれらの間に存在すれば、連結していると定義される。連結したコンポーネントは、すべてが相互に連結されたグループを排他的に定義するサブセットである。
【0042】
この実施形態において、テキスト・コンポーネントは、状態帯状メモリ26内の情報を使用して行から行へと成長させられる。帯状メモリの垂直方向は全体としてページより小さいので、構成するピクセルすべてが識別される前にコンポーネントの一部が帯状メモリから外れる可能性がある。個々のテキスト・コンポーネントの記述はプロセッサ28によって維持される。それは、現在時状態帯状メモリ行に存在するピクセル・ラン(runs)のリストから成る(図12参照)。更に、現在活動的コンポーネントのリストだけが維持される。状態帯状メモリの各行が処理されるにつれ、現在活動的であるコンポーネントのリストが新しい画像行上への継続を反映するように更新される。ランを形成するピクセルに関するRGB統計が収集され、ランを識別するデータと共に記憶される。
【0043】
テキスト・コンポーネントの生成の間に、適切にラベル付けされた状態ピクセルが、現在時の行に沿ったそれらの連結性を明示的にする隣接ランに先ず分類される。次に、ピクセル・ランの間の8個連結性およびコンポーネントの現在状態を示す(前の行から取り出される)ピクセル・ランを特定することによって、コンポーネントは拡張される。
以下の結果が発生する。
コンポーネントのレベルで
*新しいコンポーネントが作成される
*既存のコンポーネントが合併される
*既存のコンポーネントが終了する
個々のランのレベルで
*既存のランが単に拡張される
*既存のランが合併される
*既存のランがN個の新しいランへ分割される
*既存のランが終了する
連結したコンポーネントを現在の行上に成長させるアルゴリズムは、連結ピクセルを追跡するため(図13で連結とラベルをつけられている)状態ピクセルのビット・フィールドを使用して、次のように構成される。
*現在行上の連結状態ピクセルのランを定義する
*各コンポーネントに関して、現在の行の上で連結されるランのリストとピクセル・ランの現在リストを置き換え、新しく吸収されたピクセルの連結ビット・フィールドを設定する。
*ピクセルの共通のランを現在共有しているコンポーネントを合併させる
*現在の行の上で連結を見出さなかったコンポーネントを削除する
*連結されなかった(すなわちそのピクセルのコンポーネント・ビットがセットされていない)現在の行上のランから新しいコンポーネントを作成する
効率向上のため、連結されたコンポーネントのリストは、現在の行の各コンポーネントのピクセルに関する順序で保持される。各コンポーネント内のランのリストもまたその順に配列される。
【0044】
コンポーネント分析の複雑な1例が図14に示されている。2つの既存のコンポーネントが同一走査行上で合併し分割し、2つのピクセル・ランのリストを持つ1つのコンポーネントを作成する。連結されるコンポーネントの現在リストを定義する現在行上のピクセルは、黒く塗り込まれて示されている。新しい行の適切にラベル付けされたピクセル・ランは灰色で示されている。現行コンポーネント・ピクセル・ランと新しいランの間の8個隣接連結が、2つのコンポーネントを接合して単一の新しいコンポーネントを形成する点に注意する必要がある。
【0045】
連結コンポーネントが決定されると、コンポーネントを形成するピクセルのRGBデータがRGB帯状メモリ24を使用して分析され、コンポーネントが黒色テキストであるか否かが決定される。黒色テキストを識別するため次の2つの主要な基準が使用される。
*カラー収差のないこと(RGBチャネル間の最大収差に関するしきい値)、
*強度(RGBチャネルの各々に関するしきい値)。
【0046】
識別プロシージャにおいて、強度と無カラー収差に関するしきい値適用は、全体または部分的字形に対応する個々のテキスト・コンポーネントに関して収集されたRGB統計値に対して行われる。コンポーネントの走査が進行するにつれ、上記値が、主RGB帯状メモリ24の基礎ピクセル・セットから取り出される。
【0047】
新しいピクセル・ランの各々に関して統計値を累計するプロシージャが、やせたテキストと太ったテキストまたは無階調画像ピクセルを見分ける。そのプロシージャは次の表2の通りである。
【0048】
【表2】
統計値累計プロシージャ
X1をランの開始、 X2をランの終了とする。
If (X2-X1 > LengthThreshold)
/* 厚いテキストまたh画像の処理 */
境界ピクセルを無視(すなわち x | x> X1+d および x<X2-dのみ)
N番目の標本ピクセル毎に
RGB値をRGB累計値に加算
統計カウンタを増分
Else
/* やせたテキストの処理 */
探索領域を1ピクセル拡張(すなわち X1-- および X2++)
各RGBチャネルについて最小値を取り出す
最小RGB値をRGB累計値に加算
統計カウンタを増分
【0049】
このようにして、厚いランについて境界ピクセルを無視することによって、また、このランについてRGBチャネルの各々から単一の値を独立して探索することによって、画像のカラー不整列の影響は最小限度に抑えられる。
【0050】
2つのコンポーネントが1つのコンポーネントに合併されると、それらの統計も結合される。終了するか、あるいは、十分な統計値が累計された時、潜在的なテキスト字形を表す連結コンポーネントは、黒色強調に関する適合性を検査される。上述の無カラー収差および強度のしきい値基準の検証は、コンポーネントの統計値から平均RGB値の累計された推定値を計算することによって、達成される。黒色テキスト強調は、
1.R<Ti&G<Ti&B<Ti
2.MAX(R, G, B)-MIN(R, G, B)<Ta
を必要とする。但し、R、GおよびBは累計された値であり、Tiは強度しきい値であり、Taは無カラー収差のしきい値である。コンポーネントがこれらの要件を満たす場合、それを構成する個々のピクセルが適切にラベル付けされる。好ましい実施形態においては、コンポーネントの実際のピクセル範囲が暗黙裡に定義されているだけであり、ピクセル・セットに対する後方追跡(BackTrack)が必要とされる。これは、コンポーネントの底部に観察されたピクセルの最終ランから始まる以下の表3の再帰的プロシージャによって成し遂げられる(その他の技術も当業界では周知ではあるが)。
【0051】
【表3】
BackTrack(currentStatusPixel)
if visited bit set then exit
/* 対象ビットがセッt済みなら既に存在 */
if black status field is set to BLACK set it back to T2-COMPONENT
/* 黒色状態フィールドがセットされていれば黒にセットし、それをT2_COMPONENNTに戻す */
set visited bit
/* 対象ビットをオンにセットする */
for each 8-neighbour that has black status field >=T1_COMPONENT
/* T1しきい値以上の黒色状態フィールドを持つ各隣接ピクセル毎に */
BackTrack(neighbour)
【0052】
この方法で個々に検討されるコンポーネント・ピクセルは、それらのコンポーネント状態ビットの検討対象ビットをセットする点に注意する必要がある(図14参照)。
【0053】
コンポーネントが帯状メモリの高さより大きい場合があるので、コンポーネントの最上部が帯状メモリの最上部に到達する前にそれが黒色テキストであるか否かを識別する必要があろう。それゆえ、連結コンポーネントは実際には、成長の間規則的間隔で検査される(好ましい実施形態では各32画像行毎に検査される)。これは、コンポーネントが黒色テキストとして識別された後に必要とされる後方追跡の量を減じ、コンポーネントが成長させられるにつれそれに付加されるピクセルの黒色状態値が強調のため直接設定される。更に、統計値は検査の間に再初期化され、従って、黒で始まり最終的には明るいかまたは色彩を持つこととなるコンポーネントが確実に識別される。
【0054】
既に黒色テキストと識別されたコンポーネントが、黒色コンポーネント基準を結局満たさない場合、コンポーネントを形成するピクセルを再度取り出し(それらはなお帯状メモリ内部に記憶されている)、現在セットされている黒色状態フィールド値をT2_COMPONENT へ戻す(すなわち(1 0 0 0) から (0 1 0 0)へ戻す)必要がある。これは上述の黒色追跡アルゴリズムの1つのバリエーションによって行われる。コンポーネントが上述の通常の検査を通らない場合、残りの部分は黒色テキスト強調を行うため選択されることはない。
【0055】
状態バイトの黒色状態フィールドをBLACK(黒)にセットすることによって黒色テキスト・コンポーネントを形成するピクセルを識別した後のテキスト強調の次のステップは、各テキスト項目を囲むピクセルの背光を識別し、状態帯状メモリにあるピクセルをマークして白にセットすることである。このタスクは、状態帯状メモリの最上部からn番目までの行まで各行毎に実行される(但しnは背光の大きさを示す)。NOT_SETまたはT1_COMPONENTのいずれかにセットされている黒色状態フィールドを持つ背光内のすべてのピクセルはWHITE(白)にセットされる。
【0056】
図15の(a)は、状態帯状メモリの1つの領域を示す。この領域は、BLACK(0000)、T1_COMPONENT (0100)およびT2_COMPONENT (0101)に切り換えられることとなるNOT_SET(0000)にセットされているピクセルが含まれている。図15の(b)において、1つのピクセルが黒色として選択される。そのピクセルの2ピクセルだけ周辺にあるピクセルが背光として識別され(図15の(c))、その一部がWHITE(白)に切り換えられように選択される。この技術は、帯状メモリが画像上を移動するにつれ、行毎に、ピクセル毎に、黒色ピクセルに対して適用されるので、隣接するピクセルの中には前の行の処理によって既にWHITEとラベルづけされているピクセルが存在することがあるため、実際のラベル付けは上記図示されたものより複雑である。隣接分析の代替的技術もまた当業者には明らかであろう。
【0057】
BLACKテキスト・コンポーネントの周囲の背光の一部を形成するT1_COMPONENTピクセルは白に切り換えられるがT2_COMPONENTピクセルはそのようにされない点注意する必要がある。T2_COMPONENTピクセルは、黒以外のカラー(またはそのカラーが境界線の黒)である隣接コンポーネントを形成するものと仮定される。
【0058】
画像帯状メモリ24および状態帯状メモリ26の最上部において、状態情報を使用してRGBデータが更新される。黒色状態フィールド値BLACKを有するピクセルについて、主帯状メモリにおけるRGBデータ値が黒色強度値(すなわち0、0、0)にセットされる。黒色状態フィールド値WHITEを有するピクセルについて、主帯状メモリにおけるRGBデータ値が白色強度値(すなわち255、255、255)にセットされる。最後に、修正された24ビットRGBデータが帯状メモリの最上部から出力される。
【0059】
本発明には、例として次のような実施様態が含まれる。
(1)カラーまたは白黒画像を表現するカラー信号を処理し、それに引き続く処理における上記画像の表現において黒色テキスト表示を強調する画像処理装置であって、上記画像またはその一部の範囲内において各々が潜在的テキスト項目を定義する複数の隣接ピクセルからなる1つまたは複数のグループを特定するため、該画像またはその一部に関する上記カラー信号の少なくとも1つを分析する手段と、各潜在的なテキスト項目の範囲内およびその周辺におけるピクセルのカラー信号の少くともいくつかを監視して、1つまたは複数の黒色テキスト項目を識別するカラー識別手段と、上記引き続く処理における上記画像の表現において上記1つまたは複数の識別された黒色テキスト項目を強調する手段と、を備える画像処理装置。
(2)上記分析手段が、各ピクセルにおける上記カラー信号の強度を第1のしきい値と比較し、上記第1のしきい値以下の強度を持つピクセルの各々を潜在的なテキスト項目に属するものとして分類する、上記(1)に記載の画像処理装置。
(3)潜在的なテキスト項目およびそれに属するピクセルを特定するデータを記憶する手段を更に含む、上記(2)に記載の画像処理装置。
(4)上記カラー信号がレッド、グリーンおよびブルーのカラー信号を含み、上記分析手段が上記グリーン信号を分析する、上記(1)、(2)または(3)のいずれかに記載の画像処理装置。
(5)上記カラー信号がレッド、グリーンおよびブルーのカラー信号を含み、上記カラー識別手段が、潜在的テキスト項目を構成するピクセルの各々のレッド、グリーンおよびブルーの強度を監視する、上記(1)、(2)、(3)または(4)のいずれかに記載の画像処理装置。
【0060】
(6)上記カラー識別手段が、各カラー信号毎に、潜在的テキスト項目を構成するピクセルにおけるカラー信号強度の最大値、最小値および平均値を決定し、それらの値を使用して黒色テキスト項目を識別する、上記(1)、(2)、(3)、(4)または(5)のいずれかに記載の画像処理装置。
(7)上記強調手段が、識別された黒色テキスト項目の各々の範囲内のピクセルの各々を黒に設定する、上記(1)、(2)、(3)、(4)、(5)または(6)のいずれかに記載の画像処理装置。
(8)上記強調手段が、識別された黒色テキスト項目の各々の範囲内のピクセルの各々を黒に設定する場合、上記カラー信号の強度が上記第1のしきい値より低い第2のしきい値未満のピクセルのみを黒に設定する、上記(2)に記載の画像処理装置。
(9)上記強調手段が、上記識別された黒色テキスト項目に隣接する選択されたピクセルを白色またはその他の適切な背景色に設定する、上記(7)または(8)に記載の画像処理装置。
(10)上記画像を潜在的なテキスト領域と非テキスト領域に分類する手段と、上記潜在的テキスト領域を表す画像データを上記分析手段に供給する手段とを更に備える、上記(1)、(2)、(3)、(4)、(5)、(6)、(7)、(8)または(9)のいずれかに記載の画像処理装置。
(11)上記画像の選択されたセルまたは領域内の複数のピクセルに関する少なくともいくつかのカラー信号の強度を監視する手段と、各カラー信号の強度の統計的度数分布を表すデータを決定するため上記監視された強度を監視する手段と、上記統計的度数分布に従って、上記選択された領域をテキスト領域または非テキスト領域として分類する手段とを更に備える、上記(10)に記載の画像処理装置。
【0061】
(12)上記強度統計度数分布データが、上記選択された領域が分類される際、あらかじめ設定されたしきい値データと比較される、上記(11)に記載の画像処理装置。
(13)上記しきい値データが黒色強度最大しきい値および白色強度最小しきい値を含むように定義され、選択された領域が上記黒色強度最大しきい値と上記白色強度最小しきい値の間で頂点を含まず、白色最小しきい値より大きい頂点を含み、かつ、黒色最大しきい値より小さい頂点を含む場合、選択された領域はテキスト領域として分類される、上記(12)に記載の画像処理装置。
(14)各カラー信号毎に別々に上記強度統計的度数分布データを検査して頂点を識別する手段と、上記検査に応答して潜在的に密度の濃い探索空間を定義する手段と、上記探索空間の母集団を監視することによって上記選択された領域をテキスト領域または非テキスト領域として分類する手段と、を更に備える上記(11)に記載の画像処理装置。
(15)上記監視手段が上記カラー信号強度値を量子化する手段を含む、上記(11)、(12)、(13)または(14)に記載の画像処理装置。
(16)上記画像処理装置が画像データをスライド式ウィンドウまたは帯状メモリとして記憶する手段を含み、上記分析手段が上記スライド式ウィンドウまたは帯状メモリに対して動作するように構成される、上記(1)、(2)、(3)、(4)、(5)、(6)、(7)、(8)、(9)、(10)、(11)、(12)、(13)、(14)または(15)のいずれかに記載の画像処理装置。
【0062】
(17)カラーまたは白黒画像を表現するカラー信号を処理して、引き続く処理における上記画像の表現において黒色テキストの表示を強調する画像処理方法であって、上記画像またはその一部の範囲内において各々が潜在的テキスト項目を定義する複数の隣接ピクセルからなる1つまたは複数のグループを特定するため該画像またはその一部に関する上記カラー信号の少なくとも1つを分析するステップと、各潜在的なテキスト項目の範囲内およびその周辺におけるピクセルのカラー信号の少くともいくつかを監視して黒色テキスト項目を識別するステップと、上記画像の後続の表現において上記識別された黒色テキスト項目を強調するステップと、を含む画像処理方法。
【0063】
【発明の効果】
本発明によって、画像内における、白たは単色の背景を持つテキスト文字またはテキスト項目を強調表現することによって、テキストを明瞭に出力表現することができる画像処理装置および方法が提供される。
【図面の簡単な説明】
【図1】システム概要を示すブロック図である。
【図2】本発明の実施形態において使用される帯状メモリ構造を示すブロック図である。
【図3】帯状メモリの管理形態を示すブロック図である。
【図4】本発明の実施形態における帯状メモリ構造に基づく画像処理技術の実施を示すブロック図である。
【図5】本発明の実施形態の画像鮮明化ステップにおいて使用される5×5低域フィルタのブロック図である。
【図6】本発明の実施形態におけるページ分析ステップの概要を示すブロック図である。
【図7】テキスト領域として識別されるセルにおけるカラー信号に関する強度を表す典型的1次元度数分布図である。
【図8】黒色テキストに関する2つのしきい値の使用の効果を示す図である。
【図9】連続無階調領域に対して2つのしき値を使用した効果を示す図である。
【図10】状態ピクセルの黒色状態フィールドを示すブロック図である。
【図11】8個の隣接結合性を示す図である。
【図12】結合されたコンポーネントの表示方法を示すブロック図である。
【図13】状態ピクセルのコンポーネント・ビット・フィールドを示すブロック図である。
【図14】2つのコンポーネントが合併され次に分割されるテキスト領域におけるピクセルの例を示す図である。
【図15】黒色テキスト・コンポーネントの周囲の背光の中の白色ピクセルを取り出すプロセスを示す図である。
【符号の説明】
9 帯状メモリ
10 入力ブロック
11 帯状メモリ・インデックス
12 鮮明化フィルタ
14 黒色テキスト領域識別ブロック
16 黒色テキスト・コンポーネント識別ブロック
18 黒色テキスト・コンポーネント強調ブロック
20 出力ブロック
22 入力帯状メモリ
24 大きい画像帯状メモリ
26 8ビット幅状態帯状メモリ
28 プロセッサ
30 画像帯状メモリの底部
32 画像帯状メモリの上部
Claims (16)
- カラーまたは白黒画像を表現する複数のデジタルカラー信号を処理し、それに引き続く処理における前記画像の表現において黒色テキスト表示を強調する画像処理装置であって、
前記カラー信号の少なくとも一つをしきい値と比較して、それぞれが潜在的黒色テキスト項目である、一つまたは複数の隣接ピクセルのグループを識別する潜在的黒色テキスト項目識別手段と、
それぞれの潜在的黒色テキスト項目内または周囲のピクセルのカラー信号の少なくとも一部を監視して、当該潜在的黒色テキスト項目が黒色テキスト項目かどうか判断する実黒色テキスト項目識別手段と、
当該黒色テキスト項目内または周囲のピクセルの強度を修正して、それに引き続く処理における前記画像の表現において当該黒色テキスト項目を強調する黒色テキスト項目強調手段と、を備え、
潜在的黒色テキスト項目識別手段は、前記画像を潜在的なテキスト領域と非テキスト領域とに分類する手段と、当該潜在的なテキスト領域を表わす画像データだけを、実黒色テキスト項目識別手段に供給する手段とを含む、画像処理装置。 - 前記潜在的黒色テキスト項目識別手段が、前記カラー信号の少なくとも一つをしきい値と比較する手段と、それぞれが潜在的黒色テキスト項目である、一つまたは複数の隣接ピクセルのグループを、前記画像内で識別するように、当該しきい値を通過したピクセルに対して連結性分析を適用する手段と、を備える請求項1に記載の画像処理装置。
- それぞれの潜在的黒色テキスト項目および潜在的黒色テキスト項目に属するピクセルを識別するデータを記憶する手段を含む請求項1または2に記載の画像処理装置。
- 前記カラー信号が、レッド、ブルー及びグリーンのカラー信号を含み、前記潜在的黒色テキスト項目識別手段は、前記緑色信号を前記しきい値と比較する請求項1から3のいずれかに記載の画像処理装置。
- 前記カラー信号が、レッド、ブルー及びグリーンのカラー信号を含み、前記実黒色テキスト項目識別手段は、ピクセルのぞれぞれの赤、青、緑の強度を監視する請求項1から4のいずれかに記載の画像処理装置。
- 前記黒色テキスト項目強調手段は、識別された黒色テキスト項目それぞれのうちで選択されたピクセルを黒に設定する請求項1から5のいずれかに記載の画像処理装置。
- 前記黒色テキスト項目強調手段は、前記カラー信号の強度が前記しきい値よりも低い別のしきい値未満であるピクセルのみを黒とする請求項6に記載の画像処理装置。
- 前記黒色テキスト項目強調手段は、前記識別された黒色テキスト項目に隣接する、選択されたピクセルを、白または他の適当な背景色に設定する請求項6または7に記載の画像処理装置。
- 前記分類する手段は、
前記画像の選択された領域内の複数のピクセルにおいて、カラー信号の少なくとも一つの強度を監視する手段と、
監視された強度に応じて、カラー信号の強度分布を測定する手段と、
強度分布データに応じて、選択された領域を、テキスト領域と非テキスト領域として分類する手段と、を含む請求項1に記載の画像処理装置。 - 選択された領域を分類するように、強度分布データが、それぞれの所与のしきい値データと比較される請求項9に記載の画像処理装置。
- 前記しきい値データが、黒強度最大しきい値と白強度最小しきい値とを定め、カラー信号の強度分布データが、前記黒強度最大しきい値と前記白強度最小しきい値との間にピークを含まない場合であって、カラー信号の強度分布データが、前記白強度最小しきい値より上にピークを含むか、前記黒強度最大しきい値より下にピークを含むか、のいずれかまたは両方である場合に、前記選択された領域がテキスト領域と分類される請求項10に記載の画像処理装置。
- ピークを識別するように、それぞれのカラー信号に対する前記強度分布を検査する手段と、前記検査する手段に応じて、潜在的に高密度の探索空間を定めるように、前記ピークを使用する手段と、前記探索空間のそれぞれの密度を監視し、前記選択された領域を、テキスト領域と非テキスト領域として分類する手段とを含む請求項9に記載の画像処理装置。
- 前記監視する手段は、前記カラー信号強度を量子化する手段を含む請求項9から12のいずれかに記載の画像処理装置。
- 前記画像のスライド式ウィンドウまたは帯状メモリを記憶する手段を含み、前記潜在的黒色テキスト項目識別手段は、前記スライド式ウィンドウまたは帯状メモリに記憶されたデータに基づいて動作する請求項1から13のいずれかに記載の画像処理装置。
- カラーまたは白黒画像を表現する複数のデジタルカラー信号を処理し、それに引き続く処理における前記画像の表現において黒色テキスト表示を強調する方法であって、
前記カラー信号の少なくとも一つをしきい値と比較して、それぞれが潜在的黒色テキスト項目である、一つまたは複数の隣接ピクセルのグループを識別するステップと、
それぞれの潜在的黒色テキスト項目内または周囲のピクセルのカラー信号の少なくとも一部を監視して、当該潜在的黒色テキスト項目が黒色テキスト項目かどうか判断するステップと、
当該黒色テキスト項目内または周囲のピクセルの強度を修正して、それに引き続く処理における前記画像の表現において当該黒色テキスト項目を強調するステップと、を備え、
比較して識別するステップは、前記画像を潜在的なテキスト領域と非テキスト領域とに分類し、監視して判断するステップにおいて、当該潜在的なテキスト領域だけを監視して、当該潜在的黒色テキスト項目が黒色テキスト項目かどうか判断する方法。 - 前記識別するステップは、それぞれが潜在的黒色テキスト項目である、一つまたは複数の隣接ピクセルのグループを、前記画像内で識別するように、当該しきい値を通過したピクセルに対して連結性分析を適用するステップを含む請求項15に記載の方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP95306931A EP0767581B1 (en) | 1995-09-29 | 1995-09-29 | Image processing apparatus and method |
GB95306931.7 | 1995-09-29 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09139856A JPH09139856A (ja) | 1997-05-27 |
JP3828212B2 true JP3828212B2 (ja) | 2006-10-04 |
Family
ID=8221348
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP27525596A Expired - Fee Related JP3828212B2 (ja) | 1995-09-29 | 1996-09-27 | 画像処理装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US6266439B1 (ja) |
EP (1) | EP0767581B1 (ja) |
JP (1) | JP3828212B2 (ja) |
DE (1) | DE69526792T2 (ja) |
Families Citing this family (34)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3881439B2 (ja) * | 1998-01-23 | 2007-02-14 | シャープ株式会社 | 画像処理装置 |
US6310697B1 (en) * | 1998-07-07 | 2001-10-30 | Electronics For Imaging, Inc. | Text enhancement system |
US6501565B1 (en) | 1998-07-07 | 2002-12-31 | Electronics For Imaging, Inc. | Method and apparatus for smoothing text outlines |
US6429949B1 (en) | 1998-10-15 | 2002-08-06 | Electronics For Imaging, Inc. | Low memory printer controller |
US6728426B1 (en) * | 1999-08-23 | 2004-04-27 | International Business Machines Corporation | Compression of form images in gray-level |
JP2001103309A (ja) * | 1999-09-28 | 2001-04-13 | Sharp Corp | 画像処理方法及び画像処理装置 |
NL1015943C2 (nl) | 2000-08-16 | 2002-02-19 | Ocu Technologies B V | Interpretatie van gekleurde documenten. |
US7079686B2 (en) * | 2002-08-20 | 2006-07-18 | Lexmark International, Inc. | Systems and methods for content-based document image enhancement |
US20040179730A1 (en) * | 2003-03-12 | 2004-09-16 | Sharp Laboratories Of America, Inc. | Paper white determination |
US7248268B2 (en) * | 2004-04-09 | 2007-07-24 | Clairvoyante, Inc | Subpixel rendering filters for high brightness subpixel layouts |
EP1605684B1 (en) | 2004-06-04 | 2018-09-12 | Sicpa Holding Sa | Method of processing a digital image in order to enhance the text portion of said image |
US7450268B2 (en) * | 2004-07-02 | 2008-11-11 | Hewlett-Packard Development Company, L.P. | Image reproduction |
JP4329797B2 (ja) * | 2006-09-06 | 2009-09-09 | 村田機械株式会社 | 画像色判定装置、画像色判定方法及びプログラム |
US7792357B2 (en) * | 2007-05-30 | 2010-09-07 | Microsoft Corporation | Chromatic aberration correction |
US7809208B2 (en) * | 2007-05-30 | 2010-10-05 | Microsoft Corporation | Image sharpening with halo suppression |
US7783107B2 (en) * | 2007-09-06 | 2010-08-24 | Seiko Epson Corporation | Characterization of a printed droplet |
US20090214108A1 (en) * | 2008-02-26 | 2009-08-27 | Jonathan Yen | System and method for isolating near achromatic pixels of a digital image |
US8346010B2 (en) * | 2008-09-17 | 2013-01-01 | Panasonic Corporation | Image processing device, imaging device, evaluation device, image processing method, and optical system evaluation method |
AU2009201252B2 (en) * | 2009-03-31 | 2011-06-02 | Canon Kabushiki Kaisha | Colour correcting foreground colours for visual quality improvement |
US9070011B2 (en) | 2010-06-18 | 2015-06-30 | Csr Imaging Us, Lp | Automated segmentation tuner |
US8395798B2 (en) | 2010-07-15 | 2013-03-12 | Fujifilm Dimatix, Inc. | Printing objects using a rolling buffer |
JP5701181B2 (ja) | 2011-08-18 | 2015-04-15 | 株式会社Pfu | 画像処理装置、画像処理方法及びコンピュータプログラム |
JP5701182B2 (ja) * | 2011-08-18 | 2015-04-15 | 株式会社Pfu | 画像処理装置、画像処理方法及びコンピュータプログラム |
US8705881B2 (en) * | 2011-09-02 | 2014-04-22 | Adobe Systems Incorporated | Motion deblurring for text images |
US9087396B2 (en) | 2011-10-13 | 2015-07-21 | Hewlett-Packard Development Company, L.P. | Digital image text addition |
US9064191B2 (en) | 2012-01-26 | 2015-06-23 | Qualcomm Incorporated | Lower modifier detection and extraction from devanagari text images to improve OCR performance |
US20130194448A1 (en) * | 2012-01-26 | 2013-08-01 | Qualcomm Incorporated | Rules for merging blocks of connected components in natural images |
US9047540B2 (en) | 2012-07-19 | 2015-06-02 | Qualcomm Incorporated | Trellis based word decoder with reverse pass |
US9076242B2 (en) | 2012-07-19 | 2015-07-07 | Qualcomm Incorporated | Automatic correction of skew in natural images and video |
US9014480B2 (en) | 2012-07-19 | 2015-04-21 | Qualcomm Incorporated | Identifying a maximally stable extremal region (MSER) in an image by skipping comparison of pixels in the region |
US9262699B2 (en) | 2012-07-19 | 2016-02-16 | Qualcomm Incorporated | Method of handling complex variants of words through prefix-tree based decoding for Devanagiri OCR |
US9141874B2 (en) | 2012-07-19 | 2015-09-22 | Qualcomm Incorporated | Feature extraction and use with a probability density function (PDF) divergence metric |
KR102016424B1 (ko) * | 2013-04-12 | 2019-09-02 | 삼성디스플레이 주식회사 | 데이터 처리 장치 및 이를 갖는 디스플레이 시스템 |
US9390348B2 (en) * | 2014-05-19 | 2016-07-12 | Jinling Institute Of Technology | Method for categorizing objects in image |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5031034A (en) * | 1988-06-20 | 1991-07-09 | Canon Kabushiki Kaisha | Image forming and processing apparatus with identification of character portions of images |
JP2892037B2 (ja) * | 1989-04-28 | 1999-05-17 | コニカ株式会社 | カラー画像処理装置 |
JPH0372778A (ja) * | 1989-08-11 | 1991-03-27 | Fuji Xerox Co Ltd | 画像処理装置の領域識別方式 |
US5189523A (en) | 1989-11-27 | 1993-02-23 | Canon Kabushiki Kaisha | Image processing apparatus |
DE69126370T2 (de) | 1990-06-25 | 1997-10-23 | Canon Kk | Bildverarbeitungsgerät und Bildverarbeitungsverfahren |
JP3100391B2 (ja) * | 1990-08-15 | 2000-10-16 | 株式会社リコー | カラー画像の領域分離装置 |
US5696842A (en) * | 1991-07-04 | 1997-12-09 | Ricoh Company, Ltd. | Image processing system for adaptive coding of color document images |
JP3361124B2 (ja) * | 1991-07-30 | 2003-01-07 | ゼロックス・コーポレーション | テキストを含む2次元画像上での画像処理方法と画像処理装置 |
US5613015A (en) * | 1992-11-12 | 1997-03-18 | Fuji Xerox Co., Ltd. | Image signal analyzing system and coding system |
JPH08255240A (ja) * | 1995-03-17 | 1996-10-01 | Dainippon Screen Mfg Co Ltd | 画像修正装置及び方法 |
-
1995
- 1995-09-29 EP EP95306931A patent/EP0767581B1/en not_active Expired - Lifetime
- 1995-09-29 DE DE69526792T patent/DE69526792T2/de not_active Expired - Lifetime
-
1996
- 1996-09-06 US US08/714,839 patent/US6266439B1/en not_active Expired - Lifetime
- 1996-09-27 JP JP27525596A patent/JP3828212B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
DE69526792D1 (de) | 2002-06-27 |
DE69526792T2 (de) | 2002-12-05 |
EP0767581A1 (en) | 1997-04-09 |
US6266439B1 (en) | 2001-07-24 |
EP0767581B1 (en) | 2002-05-22 |
JPH09139856A (ja) | 1997-05-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3828212B2 (ja) | 画像処理装置 | |
JP2818448B2 (ja) | 自動文書セグメンテーションのためのシステム及び方法 | |
JP3686439B2 (ja) | デジタル・イメージのフォト領域検出システム、及び方法 | |
JP4295882B2 (ja) | デジタル画像データの区分方法並びにデータブロックの区分方法及び分類方法 | |
JP4242532B2 (ja) | デジタル画像データ区分方法 | |
CN1655583B (zh) | 生成具有多个前景平面的高压缩图像数据文件的系统和方法 | |
EP2645304B1 (en) | Image processing device determining binarizing threshold value | |
US7454040B2 (en) | Systems and methods of detecting and correcting redeye in an image suitable for embedded applications | |
EP1327955A2 (en) | Text extraction from a compound document | |
US8401303B2 (en) | Method and apparatus for identifying character areas in a document image | |
JPH09163161A (ja) | 画像処理装置 | |
JP2011013898A (ja) | 画像処理装置、画像処理方法、及び、プログラム | |
EP1014697B1 (en) | Method for converting observed image into ideal image | |
US6807301B1 (en) | Image production controlling device, image producing device, image production controlling method, and a storage medium | |
US7020328B2 (en) | Electronic color dropout utilizing spatial context to enhance accuracy | |
JP3772262B2 (ja) | 画像の型を識別する方法 | |
US6661921B2 (en) | Image process apparatus, image process method and storage medium | |
US6289122B1 (en) | Intelligent detection of text on a page | |
JP2000022943A (ja) | 画像領域判別装置および方法ならびに画像領域判別プログラムを記録した記録媒体 | |
US6650775B1 (en) | Method and apparatus for implementing a streaming two-dimensional digital image segmentation | |
JPH07264408A (ja) | 画像処理装置 | |
JP3070884B2 (ja) | 2値画像識別装置 | |
KR100408521B1 (ko) | 영상 데이터베이스로부터의 질의 객체 추출방법 | |
JP2001078016A (ja) | 画像処理装置 | |
JPH10200767A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20051027 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051129 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060227 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060704 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060706 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090714 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100714 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110714 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120714 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120714 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130714 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130714 Year of fee payment: 7 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313113 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130714 Year of fee payment: 7 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |