JPH1091792A - 文書セグメント化方法、装置、カラー印刷システムおよびコンピュータプログラム製品 - Google Patents

文書セグメント化方法、装置、カラー印刷システムおよびコンピュータプログラム製品

Info

Publication number
JPH1091792A
JPH1091792A JP9183525A JP18352597A JPH1091792A JP H1091792 A JPH1091792 A JP H1091792A JP 9183525 A JP9183525 A JP 9183525A JP 18352597 A JP18352597 A JP 18352597A JP H1091792 A JPH1091792 A JP H1091792A
Authority
JP
Japan
Prior art keywords
document
label
pixel
pixels
color
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP9183525A
Other languages
English (en)
Inventor
Anshin Hakan
アンシン ハカン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Seiko Epson Corp
Original Assignee
Seiko Epson Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US08/782,144 external-priority patent/US5956468A/en
Application filed by Seiko Epson Corp filed Critical Seiko Epson Corp
Publication of JPH1091792A publication Critical patent/JPH1091792A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Image Analysis (AREA)
  • Dot-Matrix Printers And Others (AREA)
  • Color, Gradation (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 テキスト領域と画像領域の両方を有する文書
をセグメント化するための方法および装置を提供する。 【解決手段】 本方法および装置は、比較的低い分解度
を有する文書において大きなテキストピクセルと画像ピ
クセルとを識別する技術を実行する。次に、本方法およ
び装置は、文書の明るい背景領域にある暗いテキストピ
クセルを検出し、各ピクセルにセグメント化ラベルを割
り当てる。これらのピクセルラベルを複数の構文規則を
使用して後処理し、ピクセルの誤ラベル付けを訂正す
る。この処理は文書の画像領域の視覚的認識結果を変更
することはない。文書の背景領域内に存在すると識別さ
れたピクセルには白ラベルが割り当てられ、テキスト領
域内に存在すると識別されたピクセルには黒ラベルが割
り当てられる。このようにして処理された文書は、テキ
スト領域と画像領域セグメント化し、シャープな黒色の
テキストと白い背景をもち、視覚的に品質を高め、また
印刷工程におけるインクの使用効率を上げる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は一般的に電子文書処
理技術、さらに詳しくは電子文書をセグメント化するた
めの方法および装置に関する。
【0002】
【従来の技術】従来より当技術分野において公知である
ように、文書はコンピュータその他のディジタル処理装
置の記憶装置内にディジタルデータ値のマトリックスと
して表現することができる。白または黒以外のカラーを
含んだ文書は、一般的に、カラー文書と呼ばれている。
カラー文書を電子的に表現するためには、画素もしくは
ピクセルの3次元値が使用されている。各ピクセル値
は、赤−緑−青(RGB)のカラー空間またはシアン−
マゼンダ−黄色のカラー空間等のカラー空間内での位置
を表している。これら以外のカラー空間も使用できる。
また公知のように、混合文書とは少なくとも1つのテキ
スト領域および1つの画像を含んだ文書の事である。本
明細書で使用しているように、画像という用語は、線画
および写真を示す語である。カラー画像は、立体ディザ
処理または簡単にディザ処理と呼ばれる技術を使用して
印刷される事が多い。
【0003】ディザ処理とは、多色の画像をその画像よ
りも色数の少ないプリンタなどの装置を使用して発生さ
せる技術のことである。画像のカラーは、密接したドッ
ト群を生成することによりプリンタなどの装置によりシ
ミュレートされる。このような方法で発生した画像は、
典型的にはハーフトーニング画像と呼ばれている。比較
的高品質の画像領域を有する混合カラー文書のハードコ
ピーを生成するためには、上記ディザ法を使用してカラ
ー画像を印刷することが望ましい。混合カラー文書が、
白色もしくは明るい色を背景とした黒色のテキストおよ
びカラー画像とを含んでいるときには、混合カラー文書
の黒色のテキスト領域および検出した背景を印刷するた
めにディザ法を使用する必要はない。
【0004】従って、混合文書の画像領域のみをディザ
法を使用して印刷するためには、混合文書の画像領域と
テキスト領域を識別する、即ちセグメント化する必要が
ある。混合文書の画像領域とテキスト領域とをセグメン
ト化すれば、文書を印刷する前にテキスト領域と画像領
域とを個別に処理することができる。混合文書をセグメ
ント化して文書のテキスト領域の位置を決定する先行技
術の手法の1つは、規則ベース型の方法であって混合文
書全体に適用する方法を利用している。
【0005】
【発明が解決しようとする課題】しかしながら、上記従
来例においては、この規則ベース型の方法の1つの問題
点は、混合カラー文書が比較的大きいので文書処理に比
較的大量のメモリを必要とすることである。このため全
文書を1度に処理することが比較的困難となる。
【0006】従って、ランダムアクセスメモリ(RA
M)の量が比較的少ないパーソナル・コンピュータ(P
C)で斯かる処理を行なうことが望ましいような場合
に、特に現実的な問題となっている。また公知のように
スキャナその他のデバイスを搭載して、例えばディジタ
ルカメラなどの装置からカラー文書およびカラー画像を
入力できるPCを提供する傾向もある。カラースキャナ
やカラープリンタなどのカラー周辺装置を有するPCは
カラー再現システムとして動作することができる。
【0007】しかし斯かるPCは典型的には、依然とし
て比較的小容量のRAMのままで提供されている。した
がって、これらPCにとっては印刷のために、混合カラ
ー文書全体に作用するセグメント化技法を使用して混合
カラー文書を処理することは比較的困難である。カラー
スキャナを通して混合カラー文書を供給することによ
り、処理装置の記憶装置内に混合カラー文書を記憶させ
るときには、混合カラー文書のセグメント化はさらに困
難となる。また、スキャニング処理中に種々の要因が走
査した画像の品質に影響を与えることがある。例えば、
スキャナを通して供給されたときに文書が歪むことがあ
る。さらにまた比較的色域の狭いスキャナでは、比較的
狭いダイナミックレンジの色を表現できるにすぎない。
色のダイナミックレンジが狭くなると、混合カラー文書
のテキスト領域と画像領域とを識別することが一層困難
となる。このように、文書スキャナで走査した混合カラ
ー文書のセグメント化は、文書の歪み、色のダイナミッ
クレンジの限界、スキャナや走査処理についてのその他
の特性を含む種々の要因によりさらに困難なものとなっ
ているが、要因はこれらに限定されるものではない。そ
の他、比較的薄いページで両面に印刷される文書にも問
題がある。例えば、雑誌の薄いページなど比較的薄いペ
ージの片面に印刷されている混合カラー文書には、同じ
ページの裏面上に印刷された文書からブリードしてきた
副産的ノイズが出ることもある。このようなページの背
景の色は、また白色というよりもやや灰色がかった白色
である場合もある。文書がその上面に印刷される用紙の
品質に関係するかかる副産的ノイズは、文書のセグメン
ト化をまた一段と困難にしている。
【0008】さらに、混合カラー文書中に生じているカ
ラー変化によってもまた混合カラー文書中でのテキスト
の位置の決定が難しくなる。比較的薄いページを走査す
るときには、このような問題は更に増大する。したがっ
て、スキャナがもたらす問題のほかに、用紙の品質およ
び印刷品質もまた混合カラー文書のセグメント化のため
の処理システムの能力に影響する、等の各種の問題点が
あった。
【0009】そこで、本発明は上記の問題点に鑑みて、
混合カラー文書からテキストを抽出する技術の提供と、
ディザ法を用いて混合カラー文書の画像領域のみを印刷
することにより比較的高品質の文書印刷出力を提供する
ことと、混合カラー文書の印刷時にカラーカートリッジ
の使用を減少できることと、さらに、走査処理の結果生
じる歪みやスキャナのカラー・ダイナミックレンジの制
限に比較的影響されない文書セグメント化技法の提供
と、用紙の品質および印刷品質に係わる副産的ノイズに
よるブリードやカラー変化に比較的影響されない文書セ
グメント化技法の提供によって、RAMの容量が比較的
少ないPCにおいても効率的な混合カラー文書の作成を
可能にし、高品質な混合カラー文書を印刷できる文書セ
グメント化方法、装置、カラー印刷システムおよびコン
ピュータプログラム製品を提供することを目的としてい
る。
【0010】
【課題を解決するための手段】上記目的を達成するた
め、本発明は、文書をセグメント化するための装置とし
て、複数のピクセルの各々をテキストクラス、背景クラ
スおよび画像クラスのいずれか1つの文書の行に配置す
るピクセル分類装置と、類似クラス中の隣接するピクセ
ルをグループにまとめるグループ化装置と、ピクセル分
類装置によりピクセルが配置されたクラスの妥当性を文
書の1行に同時に複数の構文規則を用いて決定するため
のポストプロセッサとを含んでいる。この特殊な配置に
より、混合カラー文書の白もしくは明るい背景領域から
黒いテキストを抽出するリアルタイム構文規則ベース型
文書セグメント化システムが提供される。
【0011】ピクセル分類装置は、文書の所定の行のピ
クセルをテキストクラス、背景クラスおよび画像クラス
のいずれか1つに分類する。ポストプロセッサは、ピク
セルクラスの妥当性を確認する。確認処理中に、同一ク
ラス内の連続するピクセルはラン長が計算されてグルー
プ化され、それぞれのクラスの妥当性を確認するために
1組の構文規則がピクセルのシーケンスに適用される。
ポストプロセッサは、画像行の各々に、それぞれの行内
の全ピクセルがそのラベルを変更しなくなるまで反復作
用する。更にこのシステムはピクセルのシーケンスに作
用するので、ピクセルの誤分類は典型的には文書の比較
的小さな画像領域またはテキスト領域に限定され、印刷
された混合カラー文書の外観に与える影響は比較的小さ
い。ポストプロセッサはピクセル分類装置が冒すピクセ
ルの誤分類を修正する。このようなピクセルの誤分類
は、例えば、画像ピクセルがテキストピクセルまたは背
景ピクセルとしてラベル付けされ、またテキストピクセ
ルと背景ピクセルが画像ピクセルとしてラベル付けされ
ることを生じる。比較的大きなフォントで表現されてい
るテキストは、アルゴリズムではセグメント化されずに
文書の画像領域として扱われる。
【0012】いったん混合カラー文書のテキスト領域と
画像領域がセグメント化されると、画像領域のみをディ
ザ法を用いて印刷することができ、文書テキストはディ
ザ法を使用せずに比較的高品質に印刷することができ
る。
【0013】本発明のさらに別の形態に従えば、文書を
セグメント化する方法は、プレビュー文書上の画像ピク
セルと大きなテキストピクセルを検出する段階と、文書
が印刷されている媒体(例えば,1枚の紙)の白色点の
ために所定のカラー空間内のトリプレットを計算する段
階と、媒体の黒色点についてのカラー空間内のトリプレ
ットを計算する段階と、白色点のトリプレットを使用し
て媒体の白色を補正するために補正値テーブルを発生さ
せる段階と、補正値を使用してピクセルを画像クラス、
テキストクラスおよび背景クラスのいずれか1つに分類
する段階と、分類工程中に生じるピクセルの誤分類を修
正するためにセグメント化ラベルのラン長に基づいてセ
グメント化ラベルを後処理する段階とを含んでいる。こ
の特殊技法により混合カラー文書をセグメント化する方
法が得られる。
【0014】背景領域として白色または明色の領域を分
類すると、白い記録媒体上に印刷するときにはかかる領
域は印刷する必要がなくなるので、印刷処理速度を高め
ることができる。例えば、所定のカラー空間は赤、緑、
青(RGB)のカラー空間に対応してもよく、また補正
値テーブルは明度軸および色度軸a&b(L**
* )のカラー空間内で計算してL*** 値として提
供される値に対応してもよい。好ましい実施の形態とし
ては処理中の文書は2回走査されることである。
【0015】第1の走査は比較的小さいメモリ量を使用
して記憶することのできる比較的低分解度の文書を提供
する。オリジナル文書の2回目の走査は比較的高分解度
の文書を提供する。本方法は全文書領域よりもむしろ文
書の行を利用するので、この技法では大域文書情報を有
しない。例えば、走査した文書中の画像領域および大き
なテキスト領域の位置は、数個の行情報を有するだけで
は決定することはできない。従って、このような情報を
提供するために、比較的低分解度の文書(例えば、1イ
ンチ当たり60〜90ドットの文書)を利用する。比較
的低分解度の画像を処理することにより、大きなサイズ
のテキスト領域を識別し、また画像領域は高分解度文書
中で予測することができる。大きなサイズのテキスト領
域および画像領域は、従って、比較的低分解度の画像を
処理することにより高分解度の混合カラー文書中で予測
することができる。この情報は、高分解度文書の行内の
ピクセルをラベル付けしている間に使用される。
【0016】このように、混合カラー文書の大きなテキ
スト領域と画像領域とが1度識別されると、高分解度文
書中の全ピクセルが分類されラベル付けされる。走査処
理およびセグメント化処理はともに行ベースで行なわれ
る処理であり、高分解度で走査した文書の各行は走査さ
れたままの状態で処理することができ、従って、逐次制
御文書セグメント化操作となる。後処理の段階では、分
類段階で発生することがある誤差を訂正する。このよう
な分類誤差が発生すると、例えば、画像ピクセルがテキ
ストピクセルまたは背景ピクセルとしてラベル付けされ
たり、またテキストピクセルが画像ピクセルとしてラベ
ル付けされるようになる。大きなテキスト文字は画像と
して分類され、従って、文書の画像部からはセグメント
化されない。いったん混合カラー文書のテキスト領域と
画像領域がセグメント化されると、画像領域のみをディ
ザ法を用いて印刷することができ、また文書テキストは
ディザ法を用いずに比較的高品質で印刷することができ
る。
【0017】
【作用】本発明は、画像領域のみをディザ法を用いて印
刷し、文書テキストはディザ法を使用しないで比較的高
品質に印刷できることにより、文書のテキスト領域中の
文字が鮮明且つシャープで、文書の画像領域中の画像が
高品質な混合カラー文書を比較的高速に印刷することが
できる。個々のピクセルに作用する方式なので歪んだ画
像に作用させることも可能になり、走査した混合カラー
文書の白色もしくは明色の背景上の黒い文字の認識も容
易になる。その他、全文書に対してよりはむしろ文書の
所定数の行に作用するので、メモリの使用効果を高め、
比較的少量のメモリを用いて比較的大きいサイズの混合
カラー文書をセグメント化可能となり、パーソナルコン
ピュータ・システム等の比較的小容量メモリの処理シス
テムでの使用に適している。
【0018】あるいは、セグメント化により画像領域の
みをディザ法により印刷することによって、文書のテキ
スト領域は真の黒インクを使用してプリンタで印刷する
ことができ、また検出された背景領域はインクを全く必
要としないので、カラーカートリッジの使用数を減らす
ことができる。さらに、ピクセルの個々のシーケンスを
処理することにより、文書の背景部に生じる副産的ノイ
ズであるブリーディングを除くことが可能になる。
【0019】
【発明の実施の形態】以下、本発明の実施の形態につい
て図を参照して説明する。
【0020】図1は本発明の実施の形態に係る文書セグ
メント化を行うコンピュータ・システムのブロック図で
ある。
【0021】ここで図1について説明する。図1は本発
明を実施することの出来るコンピュータ・システム10
を示す。コンピュータ・システム10は、例えば、IB
Mと互換性のあるコンピュータまたは等価のコンピュー
タ・システムとして提供される。図1に実施例として示
したコンピュータ・システム10は、説明のみを目的と
したものである。説明には特定のコンピュータ・システ
ムについて記述するときに一般に使用される用語を用い
ているが、本説明および概念は図1に示したアーキテク
チャとは異なるアーキテクチャを有するシステムを含め
て、その他の処理システムにも同様に適用される。
【0022】図1において、コンピュータ・システム1
0は中央演算処理装置(CPU)12を含み、CPU
は、例えば、従来のマイクロプロセッサ、情報の一時記
憶用のランダム・アクセスメモリ(RAM)14、およ
び情報の永久記憶用の読出し専用メモリ(ROM)16
として提供することができる。
【0023】上述の構成部品はそれぞれバス20に結合
されている。コンピュータ・システム10の操作は通常
オペレーティング・システム・ソフトウェアによって制
御・調整される。オペレーティング・システムはシステ
ム資源の割当を制御し、特に処理、スケジューリング、
記憶域管理、ネットワーキング、および入出力サービス
などのタスクを実行する。従って、システムメモリ内に
常駐しCPU12によって実行されるオペレーティング
・システムは、コンピュータ・システム10のその他の
エレメント間の操作を調整する。さらに、バス20に不
揮発性の大容量記憶装置を結合してこれをディスケット
22として提供することもできる。ディスケット22は
ディスケット・ドライブ24に挿入可能であって、ディ
スケット・ドライブ24は次にコントローラ26によっ
てバス20に結合される。
【0024】同様に、コンパクトディスク(CD)RO
M28はCD ROMドライブ30に挿入可能であっ
て、CD ROMドライブ30は次にコントローラ32
によってバス20に結合される。ハードディスク34
は、典型的にはディスク・コントローラ38によってバ
ス20に結合される固定ディスク・ドライブ36の一部
として提供される。データおよびソフトウエアは、ディ
スケット22およびCDROM28など取り外し可能な
記憶媒体を介してコンピュータ・システム10に提供さ
れ、又、コンピュータ・システム10から抽出されるよ
うにしてもよい。
【0025】例えば、図2〜18に関係して以下で説明
する技術を用いて生成されるデータ値を、媒体22、2
8と同様の記憶媒体上に記憶させてもよい。データ値は
次にCPU12によって媒体22、28から検索し、さ
らに、走査または記憶された混合カラー文書のカラー印
刷を実行するために、CPU12によって使用するよう
にしてもよい。別法として、CPU12は斯かるデータ
値をROM16に単に記憶するようにすることもでき
る。さらに、別法として、カラースキャナ46およびカ
ラープリンタ48などの周辺装置による混合カラー文書
を含む画像の、カラー走査およびカラー印刷を目的とす
る処理に有用なコンピュータ・ソフトウエアを、媒体2
2、28と同様の記憶媒体上に記憶させることが出来
る。斯かるコンピュータ・ソフトウエアは、CPU12
によって、またはスキャナ46およびプリンタ48など
1つ以上の周辺装置に含まれるプロセッサによって、即
時に実行するために媒体22、28から検索することが
できる。
【0026】CPU12はコンピュータ・ソフトウエア
を検索し、次いで後で実行するためにソフトウエアをR
AM14またはROM16に記憶するようにしてもよ
い。コンピュータ・システム10へのユーザ入力は多数
の装置によって行うことができる。例えば、キーボード
40およびマウス42はコントローラ44によってバス
20に結合される。スキャナ46はまた入力装置として
機能し、例えば、ハンドヘルド・スキャナまたはページ
・スキャナとして提供することができ、バス20に結合
される。上述のように、スキャナ46は好ましくは、混
合カラー文書の走査を行なう能力を有しており、バス2
0に同様に結合されるカラープリンタ48によってその
混合文書を後で印刷するようにすることができる。
【0027】スキャナ46は、ハンドヘルド・スキャナ
またはページスキャナかのいずれであっても、光源、電
荷結合素子アレイ(CCDアレイ)などの光感応装置、
およびCCDアレイのエレメントを逐次起動させるソフ
トウエア制御エレクトロニクスを含んでいる。400d
pi以上の解像度を有するスキャナは、256までのグ
レイレベルおよび24ビットまでのカラー解像度が利用
可能な状態で提供されている。従って、スキャナは選択
の範囲が広く、また能力の選択幅も広く、また混合文書
その他の視覚的形態で作成されたデータをコンピュータ
・システム10に入力する際の有力な入力装置となる。
紙またはフィルム等のハードコピー媒体として具体的に
作成された混合文書がスキャナ46に供給されると、ス
キャナ46はその文書のテキスト部分と画像部分の両方
を電気信号に変換する。
【0028】斯かる変換は、典型的には、画像を表示し
たハードコピー媒体の表面上の光線の移動によって実行
される。光線を手動または自動のいずれかによって、且
つ反射光を電気信号を形成する電気パルスに変換する光
感応素子アレイを用いて、ハードコピーの表面上を移動
させる。このようにして提供された電気信号は、CPU
12などのプロセッサに送信することができる。スキャ
ナ46自体にプロセッサとメモリを内蔵させて、そのい
ずれかに電気信号を送るようにできることに注目すべき
である。さらに別法として、プリンタ48にメモリおよ
びプロセッサを内蔵させて、スキャナからの信号をプリ
ンタ48に直接供給するようにしてもよい。
【0029】システム10において、プロセッサ12は
走査信号をプリンタ48に供給し、プリンタ48は画像
を印刷する。混合文書の場合には、プロセッサ12は文
書のテキスト部分と画像部分とを識別し、処理およびメ
モリ資源を有効に使用するためにテキスト部分と画像部
分とを別々に処理する。従って、コンピュータ10はス
キャナ46およびプリンタ48を図のように結合させる
ことによって、カラー画像・白黒画像、ならびに混合カ
ラー文書の両方の複写可能な複写機と同じ機能を実行す
ることができる。スキャナおよびプリンタの伝達関数は
典型的にはカラー信号を歪ませ、又、好ましくはプロセ
ッサ12により実行される伝達関数は、スキャナ46お
よびプリンタ48の伝達関数の結果を補正する。従っ
て、CPU12などのプロセッサによって、スキャナお
よびプリンタの伝達関数の逆転である機能を実行するこ
とが望ましい。
【0030】斯かる実行にはシステム10のメモリに較
正値を記憶することが含まれる。かかる較正値は本発明
の譲受人に譲渡され、また引用することによって本発明
に組み込まれる、1996年7月12日出願の同時係属
出願第08/678,884号「自動カラー修正のため
の方法および装置」中に記載の技術を含む様々な技術を
使用して計算される。
【0031】前述のように、プリンタの色域は典型的に
はスキャナの色域より狭く、このことは特に比較的安価
なプリンタに当てはまる。同様に、比較的安価なスキャ
ナは典型的には比較的高価なスキャナより色域が狭い。
ただし、走査できないカラーを印刷することは不可能な
ので、スキャナの色域外のこれらのカラーは全く無視さ
れる。コンピュータ・システム10は、さらに、バス5
2およびネットワーク54によって略記して図示した構
内通信網(LAN)または広域網(WAN)にシステム
を相互接続することのできる通信用アダプタ50を含ん
でいる。従ってデータおよびコンピュータ・プログラム
・ソフトウエアは、アダプタ50、バス52、およびネ
ットワーク54を介して、コンピュータ・システムへ、
またはコンピュータ・システムから転送することができ
る。
【0032】図2は図1に示すシステムによる文書再現
システムのブロック図である。
【0033】ここで図2について説明する。画像処理シ
ステム56は入力文書を受け取り、その入力文書をセグ
メント化プロセッサ60に供給するディジタルビットの
ストリームに変換するスキャナ58を含んでいる。セグ
メント化プロセッサ60は文書のテキスト部分、背景部
分、および画像部分をセグメント化し、次に信号を印刷
システム62に供給する。印刷システム62はセグメン
ト化プロセッサ60から信号を受信するための装置、お
よび印刷された混合カラー文書を印刷するための装置を
含む。セグメント化プロセッサ60をスキャナ58の一
部として提供できること、または別法として、セグメン
ト化プロセッサをスキャナ58とは別の分離した独立型
プロセッサとして提供できることに注目すべきである。
【0034】別法として、さらに、セグメント化プロセ
ッサをプリンタ62の一部として提供することもでき
る。セグメント化プロセッサ60の操作を図3〜18に
関係して下記に詳細に説明する。ここでは、セグメント
化プロセッサ60は混合カラー文書の画像領域、テキス
ト領域、および背景領域をセグメント化するために混合
カラー文書について操作すると言う。このことから印刷
システム62が、混合カラー文書の画像領域のみをハー
フトーニングすることによって比較的高品質の出力文書
を提供することが可能となる。混合文書について実行さ
れる処理を説明する前に、導入概念および用語について
若干説明する。
【0035】以下に記載した説明に使用されている実施
の形態では、しばしば対象となっている混合カラー文書
が幅8.5インチ、長さ11インチのページから1イン
チ当たり360ドット(dpi)の解像度で走査される
と述べられている。混合カラー文書中の画像領域の大き
さは、典型的には約34メガバイト(Mb)である。別
の例では、処理は特別の解像度(例えば720 dpi
または60 dpi)を有する画像について生じるも
のとして示されている。通常の当業者はここに記述され
た手法が様々な解像度および画像サイズを有する文書に
適用可能であることを評価するであろう。文書はまた高
解像度文書としてしばしば記述または引用される。高解
像度文書とは典型的にはおよそ360dpi以上の解像
度を有する文書をいう。
【0036】プレビュー文書としてしばしばここに引用
される低解像度文書もまたしばしば引用されている。プ
レビュー文書は90 dpi以下の解像度を有する文書
である。もちろん、通常の当業者は高解像度および低解
像度という用語もまた相対的な意味で使用できることを
評価するところである。すなわち、低解像度文書はそれ
が誘導された文書の解像度より低い解像度を有する文書
であることがある。適用によっては、90 dpiの解
像度を有する文書が高解像度文書であると見做され、一
方、30 dpiの解像度を有する文書が低解像度文書
と見做されることもあることに注目すべきである。以下
に説明する処理において、ピクセルはラベルによって識
別されることがある。
【0037】ラベルはラベルの白、黒、またはカラーと
してピクセルを識別する。従って、時として「白ピクセ
ル」の様に示されることがある。この用語は、白ラベル
を割り当てられているピクセルを示す。同様に、「黒ピ
クセル」または「カラーピクセル」として言及されてい
ることは、ピクセルがそれぞれ黒ラベルまたはカラーラ
ベルを割り当てられていることを示す。さらに斯かる文
書の分解に関連して、文書をディジタル・ワードによっ
てそれぞれ表わされるピクセルの2次元アレイに分割す
ると言われることがある。アレイは特定の寸法であるよ
うに採られているが、ここに説明する手法が様々な寸法
および形状のアレイに適用可能であることを当業者には
了解されることである。
【0038】別の例では、画像中のピクセル群が同時考
察のために選択される。斯かる選択手法の1つはローカ
ルウィンドウまたはカーネルと呼ばれる。例えば、合計
5×5のピクセルについて考えると、その群は5×5の
ローカルウィンドウ内にあると言われる。ローカルウィ
ンドウの中心はウィンドウの中央にあるピクセル上に置
くことができる。画像から形成することのできるあらゆ
るピクセル群を処理する必要のあることが多い。
【0039】これらの例においてはローカルウィンドウ
は1つのピクセル上に中心を取り、次に別のピクセルの
中心に、さらに別のピクセルの中心へと次々と移動する
ために、画像を横断して滑動すると考えることができ
る。様々な寸法および形状のローカルウィンドウの使用
が可能なことは、通常の当業者が再び評価するところで
あろう。別の例において、赤−緑−青(RGB)のカラ
ー空間または明度および色度軸a&b(L** b)の
カラー空間等の特定のカラー空間において発生する操作
に関して言及されることがある。通常の当業者は、もち
ろん、別のカラー空間も使用されること、および斯かる
別のカラー空間が使用される場合には、実行中の特定の
操作または段階を何らかの方法で修正する必要のあるこ
とを評価するであろう。斯かる修正は通常の当業者にと
って周知である。
【0040】以下に説明する処理の実施例には文書の行
の一部であるピクセルシーケンスに言及している実施例
がるが、同じ概念と手法を文書中の列の一部であるピク
セルシーケンスに適用できることにもまた注目すべきで
ある。従って、用途によっては、ピクセルの列から選択
したピクセルシーケンスを処理することが有利である
が、また、別の用途では、ピクセルの行から選択したピ
クセルシーケンスを使用することが望ましいこともあ
る。さらに別の用途では、垂直および水平の両方向のピ
クセルシーケンスで処理することが有利なこともある。
【0041】図3は図2に示すセグメント化プロセッサ
による文書セグメント化システムのブロック図である。
【0042】ここで図3について説明する。文書複写シ
ステム66は画像および大形テキスト(ILT)検出器
68および白点/黒点(WBP)検出器70を含んでい
る。ILT検出器68およびWBP検出器70はそれぞ
れに供給されるプレビュー文書を受け取る。好ましい実
施形態において、プレビュー文書は低解像度、例えば9
0 dpiまたは 60 dpiで文書を走査することに
よって生成される。別法として、プレビュー文書は、高
解像度文書を受け取って、その文書をサブサンプリング
することによって、高解像度画像より低い解像度を有す
る画像を提供するようにすることもできる。例えば、高
解像度文書は1インチ当たり720ドット(dpi)の
解像度で提供することができ、サブサンプリング文書す
なわちプレビュー文書は典型的な約60dpiの解像度
で提供することができる。
【0043】ILT検出器68はプレビュー文書画像ピ
クセルおよび大形テキストのピクセルを検出する。IL
T検出器68は文書セグメント化装置72に結合され
る。図4〜18に関係して以下で説明するように、文書
セグメント化装置72は、混合カラー文書中の画像領域
からテキスト領域をセグメント化するために行基準セグ
メント化法を使用する。斯かる行基準セグメント化法は
大文字を確実に検出し、さらにセグメント化されたエリ
アが文書の画像領域とテキスト領域のいずれに属するか
を確実に決定せしめるに十分な大域情報を有していな
い。従って、この欠点を解決するために、ILT検出器
68は供給されたプレビュー文書を操作し、混合カラー
文書に関する大域情報を生成する。
【0044】特に、ILT検出器68はプレビュー文書
中の画像ピクセル、および大形テキストピクセルの位置
を文書セグメント化装置72に提供する。この結果、文
書セグメント化装置72によって実行される誤ったセグ
メント化の数が減少する。ILT検出器68が行なう特
定の方法については図6に関係して下記に詳細に述べ
る。
【0045】WBP検出器70は文書が印刷される媒体
の白点および黒点を検出する。媒体は、例えば白または
オフホワイトなどの比較的明るい色の用紙として提供す
ることができる。WBP検出器70が、処理中の文書に
比較的明るいカラーを有する背景上に比較的暗いカラー
を有するテキストを含んでいないと判断した場合には、
文書セグメント化装置72は高解像度文書を処理しな
い。
【0046】仮にWBP検出器70が、処理中の文書に
比較的明るいカラーを有する背景上に比較的暗いカラー
を有するテキストを含んでいないと判断すると、WBP
検出器70は文書の白点および黒点を識別する。特に、
WBP検出器70は記録媒体の白点と黒点についてRG
Bトリプレットを計算する。白点は記録媒体の白を補正
するL*** 値の表を生成するために使用される。
【0047】文書セグメント化装置72はL***
値および大形テキストと画像の位置情報をILT検出器
68およびWBP検出器70から受け取り、その情報を
使用して(1)文書画像クラス、(2)文書テキストク
ラス、および(3)文書背景クラス、の3つのクラスの
うちの1つに高解像度文書中のピクセルを分類する。文
書セグメント化装置72は、次に1組の構文規則をこれ
らのラベルのラン長に適用し、単一核基準操作を行なう
ことによってセグメント化ラベルを後処理する。ピクセ
ルを分類し、後処理を実行する特定の方法については、
図6〜18に関係して下記に詳細に説明する。ここで
は、セグメント化装置72が実行する後処理操作によ
り、ピクセルの分類中に生じる可能性のある誤差が修正
されると言えば十分である。これらの誤差によって、画
像ピクセルはテキストピクセルまたは背景ピクセルとし
てラベル付けすることができ、テキストピクセルまたは
背景ピクセルは画像ピクセル等としてラベル付けするこ
とができる。比較的大きな寸法の点を有するテキスト文
字は文書セグメント化装置72によってセグメント化さ
れずに、むしろ画像として処理されることに注目すべき
である。
【0048】大きなテキスト文字は、次の(1)800
ピクセルを超える大きさを有する被接続成分、(2)1
6ピクセルを超える高さを有する被接続成分、または
(3)16ピクセルを超える幅を有していて、4ピクセ
ルを超えない高さを有する被接続成分、の3つの条件の
うちの1つを満たす文字と定義される。これらの条件の
1つを満たす被接続成分はすべて画像として分類され
る。通常の当業者は、もちろん、大きなテキスト文字を
検出するためにその他の手法を用いることが出来るこ
と、および上記の条件中に記載されるパラメータを特定
の適用において有効に処理するために修正することがで
きることを評価するであろう。文書セグメント化装置7
2は次にカラーC、黒B、および白Wとラベル付けした
ピクセル情報をハーフトーニング・システム74に提供
する。
【0049】カラーピクセルはカラーマッチング装置7
6および平滑化フィルタ78を経てハーフトーニング・
システム74に供給され、一方黒色ピクセルおよび白色
ピクセルは印刷のために直接ハーフトーニング・システ
ム74に供給される。ハーフトーニング・システム74
は、好ましくは、ディザリング技術を用いないで、真の
黒インクを有する混合カラー文書のテキスト領域内の黒
でラベル付けされたピクセルを印刷する。一方、ハーフ
トーニング・システム74はディザリング技術を用いて
カラーピクセルを印刷する。従って、ハーフトーニング
・システム74は比較的鮮明でシャープな外観を有する
比較的高品質の画像領域およびテキスト領域を有する混
合カラー文書のハードコピーを生成する。
【0050】図4〜10、12、14、および16は、
文書をセグメント化するために装置10(図1)等の装
置により実行される処理を示す一連の流れ図である。本
明細書で「処理ブロック」と名付けている短形の単位作
業(例えば単位作業82)はコンピュータのソフトウエ
ア命令または命令群を表わしている。本明細書で「決定
ブロック」と名付けている菱形の単位作業(例えば単位
作業88)はコンピュータのソフトウエア命令、または
処理ブロックで表わされたコンピュータのソフトウエア
命令の実行に影響を与える命令群を表わしている。別法
としては、処理ブロックおよび決定ブロックは、ディジ
タル信号プロセッサ回路または特定用途向けIC(AS
IC)等の機能的に等価の回路によって実行されるステ
ップを表わす。流れ図は特定のプログラム言語の構文法
を示すものではない。この流れ図は、より正確に言え
ば、通常の当業者が特定の装置に要求される処理を実行
するための回路を組み立てたりコンピュータ・ソフトウ
エアを作成するために必要な機能情報を図示したもので
ある。ループおよび変数の初期化や一時変数の使用など
の多くのルーチンプログラム単位作業が示されていない
ことに注目すべきである。
【0051】つぎに各流れ図を参照して文書セグメント
化の処理について詳しく説明する。
【0052】図4、図5は本発明の文書セグメント化シ
ステムの処理の流れ図である。
【0053】図4において、ステップ82に示すよう
に、文書処理システムは文書を受け取る。例えば、文書
は、スキャナ58(図2)などのスキャナを経て文書を
走査することによって受け取ることが出来る。別法とし
ては、文書は、コンピュータ・システムの揮発性メモリ
または不揮発性メモリなどの記憶装置内に事前記憶され
る。好ましい実施形態においては、文書は、初めは比較
的低い解像度文書としてメモリ内に文書を走査すること
によって文書処理システムに供給される。例えば文書は
60dpiまたは90dpiの解像度で走査することが
できる。文書はまた2度目にはより高い解像度、例えば
360dpiで走査することができる。
【0054】このように、方法によっては文書は2度走
査することができる。第1の走査操作は低解像度の文書
を提供し、2度目の走査操作は比較的高解像度の文書を
提供する。高解像度文書は、下記に検討するステップ9
6および98に従って走査処理の実行中に処理すること
ができる。従って、このシステムはパイプライン方式で
操作することができる。低解像度文書は、高解像度画像
の解像度より小さい解像度を有する文書を走査すること
によって得られるプレビュー文書として本明細書でしば
しば引用される。例えば、高解像度文書は360dpi
の解像度で提供することができ、一方、低解像度文書は
90dpiの解像度で提供することができる。
【0055】ここに説明するセグメント化手法は、1度
に文書全体についてよりも選択された文書行について操
作するため、文書中の大きな文字またはテキスト(すな
わち比較的大きなサイズの点を用いて印刷した文字)を
検出することは比較的困難であり、さらにセグメント化
エリアが画像領域の部分かテキスト領域の部分かを決定
することも比較的困難である。
【0056】この問題を解決するために、文書中の大き
なテキスト領域と画像領域の通常の位置に関する情報を
提供するためにプレビュー文書が使用される。この情報
は高解像度混合文書中の画像領域位置を予測するために
用いられる。この手法によって、文書の処理中に発生す
る誤セグメント化の数を減少することができる。その結
果、処理ブロック84および86に示すように、低解像
度画像を用いて、低解像度文書中の大形のテキストピク
セルと画像ピクセルが検出され、文書の白点および黒点
が計算される。次に、決定ブロック88に示すように、
文書が比較的明るい色彩の背景上に比較的暗い色彩を有
するテキストを含んでいるか否かについて決定される。
【0057】文書が明るい背景上に暗い色彩のテキスト
を含まないときには、文書はセグメント化されずに、代
わりにカラーマッチング手法によって処理されるステッ
プ90およびステップ92へと処理が続行される。決定
ブロック88において、文書が比較的明るい色彩を有す
る背景上に比較的暗い色彩のテキストを含むと決定され
ると、処理は94へ進み、そこで文書の白点が比色XY
Zプロファイルと共同でスキャナ用に使用されて、文書
の白点に対して補正されたL***値表を生成する。
次に処理は図5のステップ96へ進み、高解像度画像の
各ピクセルに対してセグメント化ラベルがそのピクセル
のL*** 値に基づいて指定される。黒(B)、白
(W)、およびカラー(C)のラベルは混合カラー文書
のテキスト、背景、および画像領域を示すために使用さ
れる。文書がすでに走査されている場合には、走査操作
の結果として文字を囲むピクセルは不鮮明になる傾向に
あり、文字よりも明るいRGB値を有する。斯かるピク
セルはカラー(C)ラベルによって示すこともできる。
各ピクセルに対するセグメント化ラベルの指定は、L*
値およびS=a2 +b2 で定義される飽和(S)を使用
する比較的簡単なマルチレベルしきい値量子化手法を用
いて達成される。
【0058】マルチレベルしきい値量子化系の一実施例
は図10を参照して後に説明する。次に、処理の流れは
処理ステップ98へ進み、ピクセルラベルの妥当性を決
定するために開発された1組の構文規則を用いてピクセ
ルラベルが後処理される。特定規則の詳細については図
14および図16を参照して後に説明する。
【0059】図6は本発明の文書中の画像領域と大きな
テキスト領域との検出処理の流れ図である。
【0060】図7は図6に示すマッピングの説明図であ
る。
【0061】ここで図6について説明する。低解像度混
合カラー文書またはプレビュー混合カラー文書の処理方
法は、2レベルしきい値量子化操作を低解像度文書につ
いて実行する処理ステップ100を含んでいる。高解像
度文書のマルチレベルしきい値量子化操作中に、高解像
度文書のすべての黒色ピクセルが低解像度文書中の対応
位置にマップされる。簡単に図7について説明する。高
解像度画像中のすべての黒色ピクセルpが低解像度画像
内の対応する位置qにマップされる。低解像度画像の場
合には、マップされたピクセルを囲むピクセルが黒ラベ
ルの妥当性を決定するために訪問される。
【0062】画像ピクセルIMGが、低解像度画像内の
3×3ウィンドウ内に存在する場合には、黒ラベルはカ
ラーラベルに変換され、存在しない場合には黒ラベルは
保存される。この操作は文書の画像領域および大形のテ
キスト領域内の黒ラベルの生成を妨げるためのものであ
り、従って誤ったセグメント化と行基準セグメント化手
法の実行時間とが減少する。しきい値量子化操作は文書
を黒色(前景)領域および白色(背景)領域に分割す
る。前景領域は画像領域およびテキスト領域の両方に対
応することができる。文書の前景領域内の画像領域とテ
キスト領域とを区別するために、処理はステップ104
に進み、そこで当業者には技術上周知である被接続成分
手法が、文書の前景領域内に位置するピクセルについて
実行される。画像領域とテキスト領域との区別は様々な
要因に基づいてなされ、その中には寸法基準が含まれる
がこれに限られるものではない。画像領域は典型的には
比較的大きな成分から成り、一方テキスト領域は典型的
に比較的小さな被接続成分から成る。寸法の基準は、ま
た表題などの大きな文字を削除するための基準として使
用することもできる。
【0063】ただし、所定の文書中の画像領域すべてを
区別するには寸法基準だけでは不十分であることに注意
すべきである。従って、処理ステップ106では被接続
成分の境界ボックスを計算する。領域についての多くの
特徴および特性が次に被接続成分の境界ボックスから計
算される。成分の寸法が境界ボックスから計算され、ま
た、大きな寸法を有する成分は画像IMGとしてラベル
付けされる。被接続成分の境界ボックス間の距離は大き
なテキスト領域および画像領域を識別するためにも使用
される。これらすべての特徴は、低解像度走査画像中の
画像領域と大きな文字とを検出するために使用すること
ができる。いったん文書が処理され、文書中の大きなテ
キスト領域と画像領域の位置が予測され、関連ピクセル
が画像ピクセルIMGとしてラベル付けされると、処理
は終了する。
【0064】図8、図9は本発明の記録媒体の白点と黒
点の計算処理の流れ図である。
【0065】図8および図9は、文書の白点と文書の黒
点を計算するために実行される処理である。好ましい実
施形態においては、この処理は走査した文書の白点につ
いてのRGBトリプレットの計算に使用される。ステッ
プ110に示すように、白点および黒色点の計算は、高
解像度文書から低解像度もしくはプレビュー文書を発生
させることにより選択的に開始される。好ましい実施形
態においては、低解像度文書は走査処理により発生させ
る。低解像度文書は、また走査した高解像度文書をダウ
ンサンプリングすることによって供給することもでき
る。プレビュー文書の解像度を上げるとトリプレットの
精度は増大するが、しかし実行時間と走査時間もまた増
大する。文書の低解像度画像は、文書のプレビューもし
くは単にプレビュー文書として本明細書で以後に引用す
る。
【0066】従って、処理速度と精度との間にトレード
オフを考慮しなければならない。またプレビュー文書す
なわち低解像度文書に対して言及されたことは、特定の
解像度を意味するものではないことに注目すべきであ
る。このような言及は、単に、高解像度文書よりも低い
解像度を有する文書が使用されていることを示している
にすぎない。文書の印刷されているページが比較的明る
い色の背景上に比較的暗い色のテキストを含んでいると
きには、用紙の空白点および黒点が計算される。この操
作を実施する1つの技法は、本発明の譲受人に譲渡され
本明細書に引用することによって組み込まれる「SYSTEM
AND METHOD FOR DETECTING THE BLACK AND WHITE POIN
TS OF A COLOR IMAGE(カラー画像の黒点および白点を
検出するためのシステムと方法)」と称する1996年
11月8日出願の同時係属の米国特許出願第08/74
7,069中で説明されている。この条件が満足されな
いときは、その文書はセグメント化されない。
【0067】条件が満たされているかどうかを決定する
ために、次に、文書のプレビューを処理ステップ112
(図8)で示すようにm × nブロックに分割する。さ
らに、ステップ114および116で示すように、未処
理ブロックが選択され、そのブロックのピクセルのそれ
ぞれの値は、単純なマルチレベルしきい値量子化系内の
しきい値と比較される。この比較結果に基づいて、それ
ぞれのピクセルに黒ラベル、空白ラベルまたはカラーラ
ベルの1つがラベル付けされる。決定ステップ118に
おいては、選択したブロックが妥当であるか(即ち、比
較的明るい色の背景上の比較的暗色のテキストの条件は
このブロックについて満足されているか)が決定され
る。この決定は選択したブロック内の白色ピクセルと黒
色ピクセルの数を考慮することにより行なわれる。
【0068】ある特定の実施の形態としては、例えば3
2列32行のピクセルを有するブロック(即ち、32×
32のブロック)においては、ブロックの処理を満足す
るためには85のピクセルが黒で170のピクセルが白
でなければならない。一般に通常の当業者であれば、そ
のブロックが妥当であると判断するためにブロック中に
必要な黒および白のピクセルの特定数は、特定の用途に
応じて選択できることを当然評価するであろう。ブロッ
クが十分な数の黒ピクセルと白ピクセルを含んでいると
きには、そのブロックは明るい背景とテキストの両方を
含んでいるものとみなし、そのブロックを妥当なブロッ
クであると識別して処理はステップ120へ進む。処理
ブロック120では、妥当ブロック内のピクセルが集め
られる。このクラスタ化の段階で、白ラベルおよび黒ラ
ベルを付したピクセルは、それぞれのRGB値に基づい
て別々にクラスタ化される。
【0069】決定ブロック118において、そのブロッ
クが妥当でないと決定されると、処理は決定ブロック1
22へ進む。決定ブロック122および処理ブロック1
24はループを実行し、このループ内で低解像度文書中
の各ブロックはステップ116、118および120に
従って処理される。すべての妥当なブロックの処理を完
了すると、処理は処理ブロック132および134へ進
み、そこで最大数のエレメントを有するクラスタ(全て
の白クラスタ中の)が決定され、その重心がその文書の
白点のためのトリプレットとなる。同様に、処理ブロッ
ク136および138において、最大数のエレメントを
有する全ての黒エレメント中のクラスタが決定され、そ
の重心がその文書の黒点のトリプレットとなる。処理ブ
ロック140に示すように、黒点および白点はシグモイ
ドを構築するために使用される。このシグモイドは、カ
ラーラベルCに対応するラベルを有するピクセルを行に
基づいてセグメント化した後に適用されるフィルタを構
築するために使用される。
【0070】このフィルタは低RGB値を(0,0,
0)にプルダウンし、また高RGB値を(255,25
5,255)にプルアップする。すべてのRGBトリプ
レットについて、そのトリプレットが(0,0,0)も
しくは(255,255,255)にならないときは、
トリプレット値は保存される。この操作は、セグメント
化操作から生じることのある輪郭効果を平滑化するが、
しかしピクセルの色相を変化させることはない。
【0071】図10、図11は本発明の文書セグメント
化の処理の流れ図である。
【0072】図10および図11について説明する。M
× Nの寸法の画像に対する文書セグメント化処理は初
期化ステップ142、144を含んでおり、ここでカウ
ンタおよび複数のメモリバッファ・アレイr,s,dお
よびlが初期化される。走査された文書は空白境界ピク
セルに取り囲まれているので144内のバッファは白ピ
クセルで初期化されることが想定される。
【0073】図12は図10に示す所定数の連続画像行
のためのRGB値を含むバッファの略図である。
【0074】図13は図10に示すRGBバッファ内に
記憶された画像行のためのピクセルセグメント化ラベル
を含むバッファの略図である。
【0075】ここで図12および図13を簡単に説明す
る。これらは本手法に従って文書をセグメント化するた
めに使用したそれぞれr,d,およびsと表示されたメ
モリバッファ174、176および178についての説
明図である。図12はrと表示したバッファ174がn
個の逐次画像行についてのピクセルRGB値を含んでい
ることを示している。この例では、rバッファ174は
バッファ行r[0]〜r[6]内に7つの逐次画像行を
保持していることを示している。図13はsと表示され
たバッファ178の説明図である。sバッファ178は
内部に、rバッファ174の行内に記憶された同じ画像
行についてのピクセルセグメント化ラベルを記憶してい
る。したがって、この例では、バッファ178は、その
s[0]〜s[6]位置に、rバッファ174の行r
[0]〜r[6]内に記憶された同じ画像行についての
ピクセルセグメント化ラベルを記憶している。dと表示
されたバッファ176はsバッファ178から最も新し
い時期に押し出された行のセグメント化ラベルを含んで
いる。
【0076】上記のように、本発明の処理手法は、それ
ぞれr,s,dおよびlで示した4つのバッファアレイ
を使用することにより容易になる。バッファr,sおよ
びdは図12および13に示した。ピクセル輝度L* 値
を有するバッファlの構造は、バッファ178の構造と
同じである。したがって、バッファlは7つの行l
[0]〜l[6]を含んでいる。画像の高さと幅をそれ
ぞれMおよびNで表示すると、バッファr,sおよびd
の寸法はは、それぞれ3n × N, n × NおよびN
となる。この実施例では、バッファr,s,dおよびl
内の各ピクセルに対する最小メモリ要求はそれぞれ8ビ
ット、2ビット、2ビットおよび8ビットである。3つ
の異なるラベルがあるのみなので、ピクセルのラベルを
維持するには2ビットで十分である。バッファs,r,
dおよびlの合計メモリ要求は、したがって、下記のよ
うに計算することができる。
【0077】3n** 8+n** 2+n** 8+
* 2=(34nN+2N)ビット図10および図11
について再度説明する。指標iおよびメモリバッファ
r,s,dおよびlが初期化された後、処理は決定ブロ
ック146に進み画像のM行すべてが処理されたかを決
定する。全ての行が読み込まれているときには、処理は
ステップ148に進み、そこで空白ピクセル値すなわち
境界ピクセル値がr,sおよびlバッファ内に記憶さ
れ、処理はステップ158に進む。全ての行の処理が完
了していないときには、処理はステップ150に進み、
ここでi番目の画像行はrバッファ174の行r[6]
に読み込まれる。次に、処理はステップ152に進み、
ピクセルr[6]についてのL*** 値が正四面体
補間法により計算される。文書の白点はスキャナの比色
XYZプロファイルと関係して使用され、文書の空白に
ついて補正されたL*** 値表を発生させる。
【0078】次に、処理ステップ154に示すように、
* 値がlバッファ(図示されていない)内の[n−
1]位置に記憶される。次に、ステップ156に示すよ
うに、ピクセルをそれぞれのL*** 値に従って分
類し、ピクセルラベルをsバッファ178内のsバッフ
ァ[n−1]位置に記憶する。
【0079】上記のように、そのL*** 値に基づ
いて高解像度画像のピクセルにセグメント化ラベルが割
り当てられる。テキスト領域、背景領域および画像領域
をマーク付けするために黒ラベル(B)、白ラベル
(W)およびカラーラベル(C)が使用される。走査操
作の結果、文字を取り囲んでいるピクセルはぶれを生
じ、その文字よりも明るいRGB値を持つことになる。
これらのピクセルはまたカラーラベルCでマーク付けし
てもよい。
【0080】分類処理は、L* 値および下記に定義する
彩度Sを利用した比較的単純なマルチレベルしきい値量
子化技法を使用して達成してもよい。
【0081】S=a2 +b2 ある行のL* 値は、その行がrバッファ174から押し
出されるまでバッファ内に保持されている。次のマルチ
レベルしきい値量子化系がピクセルpの分類に用いられ
る。
【0082】(L* (p)>Tw 1 ,S(p)<T
s w 1 ),または(L* (p)>Tw 2 ,S(p)<T
s w 2 )であれば,ピクセルラベルはW;また、((L
* (p)<TB 1 ,S(p)<Ts B 1 ),または(L
* (p)<TB 2 ,S(p)<Ts B 2 )であり、プレ
ビュー画像内の対応する3×3ピクセル・ウィンドウ内
にいずれの画像ピクセル(IMG)も存在しなければ、
ピクセルラベルはB;上記以外は、ピクセルラベルは
C。
【0083】上記に定義したしきい値間の関係は次の通
りである。
【0084】Tw 2 <Tw 1 ;Ts w 2 <Ts w 1 ;T
B 1 <TB 2 ;およびTs B 1 <Ts B 2 上記のしきい値は、関係するスキャナによって走査され
るカラーランプについて経験的に決定される。上記のラ
ベル付け処理は、比較的高速で行なわれるが、分類誤差
を生じ易い(例えば、画像ピクセルを、テキストもしく
は背景に、またはその逆にラベル付けするなど、誤った
ラベル付けをすることがある)。これらの誤差を訂正す
るために、図14、16および18に関係して以下に詳
細に説明するように、ラベルについて後処理操作が実施
される。
【0085】図14は本発明のカラーラン長の処理の流
れ図である。
【0086】図14のカラーラン長の処理を示す流れ図
は、処理ステップ179に示すように、行バッファ指標
iは、中央行の指標よりも1つ大きい行番号に設定され
ている。例えば、7行を同時に処理するシステムではn
は7に等しく、したがってステップ179の処理では行
バッファ指標iには4の値が割り当てられる。決定ブロ
ック181では、処理に必要な行の最後の行が処理され
たか否かを判断する。
【0087】したがって、7行を使用し3行を同時に処
理する場合には、2番目の行が処理されると処理は終了
する。ただし処理に必要な複数の行の最後の行の処理が
完了していないときには、処理はステップ182に進
み、i番目の行についてのsバッファ178(図13)
が計算され、その行のラン数Mが判断される。このよう
にしてステップ182で所定の行についてM個のランが
識別される。次に、処理ステップ183に示すように、
変更フラグを1に設定する。変更フラグは所定のピクセ
ルシーケンス(即ちラン)中のピクセルのいずれかのラ
ベルが変更されたことを示す。ステップ184におい
て、変更フラグの状態が確認される。処理の開始時の場
合のように、4行目の処理中にも変更フラグが0に設定
されていなかったときには、処理はステップ186に進
み、変更フラグは0に設定される。
【0088】処理は次にステップ188に進み、カウン
タjをリセットする。カウンタjは各行のラン数をカウ
ントし、行中の全てのランがチェックされたことを保証
するために用いられる。次に処理はステップ190に進
み、j番目のランがカラーランであるか、またそのラン
の長さが所定のしきい値長さTL よりも小さいかどうか
について決定を行なう。カラーラン長がしきい値長さT
L よりも大きいときは、そのカラーランが文書のテキス
ト部分であるよりも文書の画像部分であると判断し、そ
のカラーランに構文規則を適用しない。カラーランを定
義するピクセルシーケンスの長さが所定の長さTL より
も小さいときには、処理はステップ192に進み、j番
目のランに構文規則が適用される。構文規則は下記に列
挙する。
【0089】構文規則の適用後、処理は決定ブロック1
93に進み、構文規則を適用した結果としてピクセルラ
ベルのいずれかに変更が生じたかについての決定が行な
われる。ピクセルラベルに変更がなければ、処理はステ
ップ195に進み、カウンタjが増分される。決定ブロ
ック196はi番目の行のM個のランの全てがチェック
されたことを保証するためにループを実行する。決定ブ
ロック196はループを実行してi番目の行のM回の実
行が全てなされたことを保証する。i番目の行のM個の
ランの全てがチェックされたことが保証されたときに
は、処理は決定ブロック184に進み変更フラグが検査
される。変更フラグが最初に所定値と等しい値を有する
とき、ここでは0のときは、構文規則を適用した結果と
してピクセルラベルに変更が生じなかったことを示して
おり、処理はステップ185に進み、行バッファ指標i
が減分される。
【0090】行バッファ指標iは走査順序と逆の順序で
行を処理することが望ましいので、増分されるよりは減
分される。例えば、バッファの第3行を処理する前に行
バッファの第4行を処理する必要がある。ピクセル分類
処理はテキストピクセルを取り囲んでいるぶれのあるピ
クセルを、カラーピクセルとしてラベル付けしてもよ
い。したがって、これらのピクセルはさらにしきい値量
子化されなければならない。正確なセグメント化を行な
いまたシャープな文字を発生させるためには、これらの
ピクセルをBLACK(黒)もしくはWHITE(白)
のいずれかにラベル付けしなければならない。
【0091】この目標を達成するために、下記に列挙し
た1組の構文規則が種類別に開発され、BLACK、W
HITEおよびCOLOR(カラー)ピクセルラベルの
ランの長さがラベル付けしたピクセルに適用される。そ
れぞれのラン長について2種の情報が記録される。第1
の情報はランの種類、すなわち、COLOR、WHIT
E、BLACKであり、第2の情報はランの長さであ
る。ラン長の最初の位置を記憶させる必要はなく、この
情報はランの長さから抽出することができる。長さNの
所定の画像行についての異なるランの最大数はNとな
る。ピクセルラベルのラン長からは現画像走査線の内容
に関する情報が得られる。下記に列挙した規則はピクセ
ルラベルのシーケンスの観察から開発された。
【0092】例えば、文字を含んだ画像走査線が、1方
の端から他方の端に移動させられると、WHITE、C
OLORおよびBLACK(W、C、Bで表すこともあ
る)の順序でピクセルのシーケンスを観察することがで
きる。このようなシーケンスはその走査線内において白
の背景からテキスト文字に遷移したことを示している。
同様に、BLACK、COLORおよびWHITEの順
序でピクセルのシーケンスを観察することもある。この
ようなシーケンスはテキスト文字から白の背景に遷移し
たことを示していることもある。同様の観察に基づい
て、5種の異なる構文規則を構築した。
【0093】ピクセルラベルRを有するピクセルのシー
ケンス(ピクセルランとも呼ばれる)はそのピクセルラ
ベルがカラーラベルC、黒ラベルBまたは白ラベルWの
うちの1つであればR1 で表すことができる。したがっ
て、Rは下記の方程式で表すことのできるカラーC,黒
Bまたは白Wの群に属している(以下の式で、εはその
左辺が右辺の集合に属していることを示す):Rε
{C,B,W}。
【0094】ピクセルのシーケンスの長さはlで表す
と:lε{x+ ,x- ) ここでxεN,x+ はラン長がxより大きいか等しいこ
とを表し、またx- はラン長がxより小さいか等しいこ
とを表す。
【0095】したがって、ラベルrで長さlのランiは
l i で表される。調査中のラン長はそのラベルを太字
体で、例えばRのように表わされる。したがって、カラ
ーラベルを有するピクセルのシーケンスを調査している
場合には、カラーラベルを有するピクセルのシーケンス
はCで表される。カラーランCとしてラベル付けされた
ランが下記の5つの規則の1つを満足すると、ピクセル
のシーケンス内の全てのピクセルがそれぞれのL* 値に
基づいてしきい値量子化され、そのシーケンス内のピク
セルに関連するラベルがBもしくはWのいずれかに変更
される。
【0096】下記に定義した5つの規則は、2+ ,2-
など、ある長さの値を持っている。これらの特定の長さ
は走査解像度360dpiに合わせて選択されているこ
と、またその他の解像度についてはその他の長さが好ま
しいこともあることに注目すべきである。また、その他
の規則を画像の特性に基づいてランの種類および長さを
使用して発生させることができることも注目すべきであ
る。
【0097】・規則1 規則1は白い背景から黒いテキストへの遷移があるかを
決定する。
【0098】((W2+ i-32- i-21 i-1 または W2+
i-3i-21 i-1 または W2+ i-1)C10- i2+ i+12-
i+22+ i+3 または(W2+ i-32- i-21 i-1 または
2+ i-3i-21 i-1 または W2+ i-1)C10- i2+ i+1
2- i+2)) であれば、COLORラン中のピクセルはそれぞれのL
* 値に基づいてしきい値量子化される。
【0099】・規則2 規則2は黒いテキストから白い背景への遷移を検出する
ために使用されるため、規則2は規則1と相補関係にあ
る。
【0100】(W2+ i-32- i-22+ i-110- i(W2+ i+1
または W1 i+1i+22+ i+3または W1 i+12- i+2
2+ i+3) またはW2+ i-22+ i-110- i(W2+ i+1 また
は W1 i+1i+22+ i+3 またはW1 i+1
2- i+22+ i+3)) であれば、COLORラン中のピクセルはそれぞれのL
* 値に基づいてしきい値量子化される。
【0101】・規則3 規則3は文字先端でのカラーランを検出する。
【0102】(Wi-130- ii+1)であれば、隣接する
上2行および下2行を確認する。上2行のいずれかに重
なり合った黒ランおよび下2行のいずれかに重なり合っ
た白ランがあるとき、または下2行のいずれかに重なり
合った黒ランおよび上2行のいずれかに重なり合った白
ランがあるときには、または上2行のいずれかに重なり
合った黒ランおよび下2行のいずれかに重なり合った黒
ランがあるときには、COLORラン中のピクセルはそ
れぞれのL* 値に基づいてしきい値量子化される。
【0103】・規則4 カラーランが文字内にあることを検出する。
【0104】(W2+ i-2i-130- ii+1 または W2+
i-3i-2i-130- ii+1または Bi-130- ii+1
2+ i+2 またはBi-130- ii+1i+22+ i+3 ) であれば、COLORラン中のピクセルはそれぞれのL
* 値に基づいてしきい値量子化される。
【0105】・規則5 この規則は上記規則のいずれも適用できないときに適用
される。規則5は所定の5×5ウィンドウ内のBLAC
K、WHITEおよびCOLORのピクセルの数を計算
する。黒ピクセルの数がカラーピクセルの数よりも大き
く、また白ピクセルの数がカラーピクセルの数よりも大
きいときには,ウィンドウ中央のカラーピクセルはその
* 値に基づいてしきい値量子化される。
【0106】図15は図14に示す5×5カーネルのカ
ラーラベルを有するピクセルのシーケンスへの適用を表
す図である。
【0107】例えば、図15において、5×5ウィンド
ウ197はその中央にピクセル199を有するカラーラ
ン198に適用されている。ウィンドウ197内の黒ピ
クセルBLACKの数がウィンドウ197内のカラーピ
クセルCOLORの数よりも大きく、またウィンドウ1
97内の白ピクセルWHITEの数がウィンドウ197
内のカラーピクセルCOLORの数よりも大きいときに
は、カーネル中央部(図15の斜線で影付けをしていな
いドット198)のカラーピクセル199はそのL*
に基づいてしきい値量子化される。
【0108】図15の斜線で影付けしたドットはBLA
CK、WHITEまたはCOLORラベルを有すること
ができる。この操作は、カラーランの最後の要素に及ぶ
まで、カーネルを移動させて反復される。
【0109】上記規則1−5の中には、長さのサブ指標
を持たないランもあることに注目すべきである。これは
この規則がラン長に影響されないことを示している。ま
た、規則の中には、現在処理中の画像行に隣接したピク
セルラベルに適用されるものがあるので、隣接行は現在
行の処理に先行して処理されなければならないことに注
目しなければならない。この理由により、バッファs上
の行nを処理するために、行nに先行して行n−1が処
理される。行nを処理した後に、行n+1が処理され
る。これにより行n+1上のピクセルは、行nおよびn
−1上の変化に基づいてそれぞれのラベルを確認するこ
とができる。この処理を図14に示す。
【0110】5つの構文規則に関して上述したラン長は
走査解像度360dpiで走査した文書に対するラン長
である。通常の当業者であれば他の走査解像度に対して
は他の長さが選択されることが好ましいことを当然評価
するであろう。いずれの用途に使用するためであっても
特定の長さの選択は、種々の要素に依存し、その中には
文書の走査解像度、フォントの種類およびサイズが含ま
れるが、これらのみに限定されるものではない。
【0111】図16、図17は本発明の白ピクセルおよ
び黒ピクセルを後処理するための実行段階の流れ図であ
る。
【0112】ここで図16について説明する。この後処
理操作は、また、図14および図15に関係して上に説
明したピクセル分類操作およびカラーピクセル後処理操
作により生じたピクセル誤分類を訂正する。黒ピクセル
および白ピクセルの後処理は、文書の画像領域内で黒ピ
クセルおよび白ピクセルをカラーピクセルに転換できる
ことが理想的である。一般に、文書の画像領域内で生じ
る黒ピクセルの誤発生は、文書の画像領域内で生じる白
ピクセルの誤発生よりも目立ち易い。
【0113】しかし、ピクセルの幾つかに誤ったラベル
が付けられ(例えば、画像ピクセルが白ラベルを受け取
る)また誤ったラベル付けを訂正できない場合において
も、本明細書に説明した技術はピクセルに基づいた技術
であり性能低下はわずかであるので、印刷された文書画
像に与える影響は比較的小さい。白ピクセルおよび黒ピ
クセルの後処理は、Cラベル、BラベルおよびWラベル
を有するピクセルのラン長に基づいた構文規則に従って
実行される。
【0114】白ピクセルおよび黒ピクセルの後処理は、
図13のsバッファの最初の2行、s[0]およびs
[1]、および記憶場所s[0]から記憶場所d[0]
内に最も新しく転送された画像行の3つの画像バッファ
により容易となる(図13)。記憶場所s[0]は黒お
よび白ピクセルの後処理の後にバッファから押し出され
る画像行を含んでいる。
【0115】下記に列挙した複数の構文規則は、バッフ
ァ178の記憶場所s[0]内の黒および白ピクセルの
妥当性を決定するために使用される。混合カラー文書の
画像領域内のみに構文規則を適用することが望ましい。
したがって、構文規則は、混合カラー文書の画像領域内
で白および黒ラン位置を設定するために開発されたこと
に注目すべきである。
【0116】処理ステップ200に示すように、処理は
文字の先端部に存在するカラーピクセルのクランプを除
去することにより開始される。このステップは、所望の
白ランおよび黒ランの後処理に先行して実施され、また
所定のしきい値長さよりも小さい長さを有するカラーラ
ンに、図15に関係して上記したカラー後処理操作の規
則5を適用することにより達成される。しきい値長さは
経験的に選択され、解像度約360dpiの画像に対す
るしきい値長さは10になるように選択される。ただ
し,文字の先端部に存在するカラーピクセルのクランプ
を排除できるしきい値長もまたすべて使用できることを
注目すべきである。なお、特定のしきい値長さは画像解
像度を含むがこれに限定されない種々の要因に従って選
択される。上記のしきい値長とメモリのバッファサイズ
で、また更に重要なことであるが、後処理が3画像行上
について実施されるのでカーネルのサイズは5×5から
3×5に変更されることに注目すべきである。
【0117】処理は次にステップ201に進み、ここで
ラン長は、画像行用のピクセルセグメント化ラベルを記
憶しているバッファ178の第1行s[0]に記憶され
ているピクセルセグメント化ラベルのそれぞれについて
計算される。次に処理はステップ202に進み、白ラベ
ルを有するピクセルランが選択される。次に、処理ステ
ップ204に示すように、複数の構文規則を適用して白
ラベルを有するピクセルランを選択する。構文規則は長
さTw よりも小さい白ラベルピクセルランに適用され
て、文書の画像領域内に白ランが発生しているか否かを
決定する。
【0118】この処理は、隣接するカラーランの長さを
確認することにより、また現白ラン中のピクセルのL*
値を確認することにより達成される。白ランはカラー文
字内に発生することもある。白ラベルを有するピクセル
ランであってカラー文字内に存在するピクセルランは、
それぞれのラベルを、カラーランに囲まれている場合に
おいても、白ラベルからカラーラベルに転換しないよう
にしなければならない。これらの白ランがカラーランに
転換されると、発生するセグメント化は知覚的に不安定
化される。
【0119】例えば、ある文書が白または明るい背景上
に印刷されたカラーテキストを(例、赤色のテキスト)
を含むと仮定する。この場合、文字「O」のような文字
の水平軸を通して取られたピクセルラベルは,...W
CCW'W'W'CW...のように表されると考えられ
る。この場合、ダッシュ付WラベルすなわちW'で示し
た白ピクセルは、白ラベルからカラーラベルに変更すべ
きではない。もしもこのような変更が行なわれると、文
字「O」の中央部分は白でなくなり、その結果、セグメ
ント化の品質は知覚的に低下する。
【0120】上記のピクセルラベルの転換は次の規則を
適用することにより達成される: A.(C30+ i-1i または Wi30+ i+1 または C
30+ i-2i-1i またはWii+130+ i+2 または C
30+ i-3i-2i-1i またはWii+1i+230+ i+3
である場合、もし C3+ i-12- i3+ i+1 であれ
ば、Wラン中のピクセルラベルをCに変更し;また、も
し Ci-39- i-29- i-130- i9- i+19- i+2i+3
であれば、Wラン中のピクセルラベルをCに変更し;ま
た、もし Ci-1ii+1 であれば、Wラン中の各ピ
クセルpについて、L* (p)<Tc であること
を確認して、pのピクセルラベルをCに変更し;また、
もし(C10+ i-1ii+1i+2 または Ci-2i-1i
10+ i+1 または C10+ i-13- ii+1 または Bi-1
3- i10+ i+1)であれば、Wラン中のピクセルラベル
をCに変更する。
【0121】B.(Ci-12- ii+1 または Bi-1
2- ii+1 またはCi-12- ii+1)である場合、Wラ
ン中の各ピクセルpについてL* (p)<Tc である
ことを確認して、pのピクセルラベルをCに変更する。
【0122】しきい値Tc の値は、ピクセル分類体系の
説明図である図10に関係して上記に定義したしきい値
w 2 と等しい。処理は次に決定ブロック206に進
み、構文規則を適用したことにより、白ピクセルラベル
に変更が生じたか、また変更されなかったかを決定す
る。もしいずれかのピクセルラベルに変更が生じた場合
には、処理ブロック208に示すように、変更フラグが
設定される。
【0123】一方、もしいずれのピクセルラベルにも変
更が生じなかった場合には変更フラグは設定されず、処
理の流れは、s[O]内の各白ラベルランに対して構文
規則を適用するループを形成する決定ブロック210お
よび処理ブロック212に直接進む。
【0124】白ラベルを有するピクセルランの全てに構
文規則が適用されると、処理の流れは処理ブロック21
3に進み、s[O]上のラン長を再計算し、次いでブロ
ック214で黒ラベルを有するピクセルランを選択す
る。次に、処理ステップ216に示すように、選択した
黒ラベルを有するピクセルランに複数の構文規則が適用
される。黒ラベルを有するピクセルランに適用された構
文規則は、黒ランが文書の画像領域に生じているかを決
定する。
【0125】これは選択した黒ランの隣接するカラーラ
ンの長さを確認することにより達成される。隣接するカ
ラーランが予め選択した長さよりも長いときには、また
黒ランがその直接隣接する左2行および右2行のラン中
に白ランがないときには、黒ランのピクセルのラベルは
黒BからカラーCに変更される。上記の黒ラベルを持つ
ピクセルランのラベル転換を以下に説明する: A. もし(C10+ i-1i または Bi10+ i+1 また
は C30+ i-29- i-1iまたは Bi9- i+130+ i+2
または C30+ i-39- i-29- i-1i またはBi9-
i+19- i+230+ i+3 または Bi-2i-1ii+1
i+2)であって、もし(Ci-1ii+1 または Wi-1
ii+1 または Ci-1ii+1または Ci-2i-1
ii+1i+2)であれば、Bラン中のピクセルラベル
をCに変更する。
【0126】B. また、もし C3+ i-2i-13+ i
i+13+ i+2 であれば、Bラン中の各ピクセルpについ
てバッファd[O]およびs[1]内の同位置にあるp
の2つの隣接するピクセルの両方がラベルCを有する
か、いずれか1つがCであり他方がWであることを確認
して、pのラベルをCに変更する。
【0127】上記のXとラベル付けされたランは黒ラン
Bもしくは白ランWのいずれかを示す。
【0128】黒および白ピクセルの確認のために上述し
たランの長さは、走査解像度360dpiで走査された
文書に対するラン長である。一般的な当業者であれば、
他の走査解像度については好ましくは他の長さを選択で
きることをもちろん評価するであろう。いかなる用途に
用いられようとも特定の長さの選択は、文書の走査解像
度、フォントタイプおよびフォントサイズを含む種々の
要因に基づいて行なうことができるが、これらに限定さ
れるものではない。その他の構文規則は対称とする画像
に基づいて発生させることができることに注目すべきで
ある。
【0129】例えば、特定の種類の画像(例えば、海浜
の場面)を含んだ1組の特定の混合カラー文書は、最適
操作のために1組の特注の構文規則を必要とすることが
ある。しかし、このような規則もまたラン長およびラベ
ルによって決まる。別法として、カラーテキストもしく
は特定の背景色を有する1組の混合カラー文書は、それ
に応じて構文規則を特注することによりさらに効果的に
処理することができる。
【0130】また、フォントスタイル(例えば,イタリ
ック)、フォントサイズもしくは文書の解像度の変更に
応答して構文規則を修正もしくは変更することが望まし
い。しかし、本明細書で提示した規則は多様な混合カラ
ー文書を満足させるものである。白ラベルを有するピク
セルに構文規則を適用した後、処理は決定ブロック21
8に進み、構文規則を適用した結果、いずれかの黒ピク
セルラベルに変更が生じたか否かを決定する。いずれか
のピクセルラベルに変更が生じているときには、処理ブ
ロック220に示すように,変更フラグが設定される。
【0131】一方、ピクセルラベルに変更が生じなかっ
たときには、変更フラグは設定されずに処理の流れは直
接ループを実行する決定ブロック222および処理ブロ
ック224に進み、構文規則が文書の画像領域内の各黒
ラベルランに適用される。黒ラベルを有するピクセルラ
ンの全てに構文規則が適用されると、処理は決定ブロッ
ク226に進み、白および黒ピクセルランの処理中に変
更フラグが設定されたか否かを決定する。変更フラグが
設定されたときには、処理ループはステップ201に戻
り、構文規則を白および黒ピクセルランに適用すること
により変更フラグが設定されなくなるまでこの処理が反
復される。
【0132】図18は本発明の行内の1組のピクセルの
位置のための垂直ランを示す図である。
【0133】図19は本発明の行のピクセルラベルを付
して更新した1組の垂直ランを示す図である。
【0134】図18および図19はピクセルの垂直ラン
を処理するための1つの技法の説明図であり、バッファ
178(図13)の第1行s[0]に記憶されているピ
クセルを、処理ステップ図11で説明したように、17
6のバッファ(図13)の行d[0]に転送する前に、
バッファ178の行s[0]のカラーピクセルを使用し
て垂直カラーランを発生させる(即ち、ピクセルシーケ
ンスの列)。これらのランは後処理した文書の行の各ピ
クセル位置におけるカラーピクセルの活動記録を保存す
る。
【0135】この情報は画像領域のテキストおよびバッ
ファs[0]の背景領域からの距離を決定すめるために
使用され、またこの情報は黒ピクセルおよび白ピクセル
の後処理中に使用することができる。白ピクセルおよび
黒ピクセルについて同一タイプの垂直ランを計算するこ
とができる。垂直ランは8ビットを各ピクセル位置に割
り当てることにより極めて効果的に計算することがで
き、またn行における各カラーピクセルについて垂直ラ
ンにラベル1を挿入することができる。この処理を下記
の図で説明する。
【0136】ここで述べる例では8ビットを使用してい
るが、一般的な当業者であれば8ビットより大きいビッ
トも小さいビットも使用できることを評価するであろう
ことに注目すべきである。例えば、ランの長さは、前に
後処理された行に関連してさらに情報を収集するために
大きくすることができる。図18は234で示すn行上
のピクセル位置iおよびi+1に対応する垂直ラン23
0および232を示す。s[0]バッファ内の文書行n
は、230aおよび232aで示すピクセル位置iおよ
びi+1における2つの1によって表示した2つのカラ
ーピクセルを有している。ピクセル位置iにおける垂直
ランは、行n−1、n−2およびn−3上の同位置に3
つの連続カラーピクセルがあったこと、また行n−4、
n−5およびn−6上の同位置に3つの連続非カラーピ
クセルがあったことを示している。
【0137】図19は垂直ラン230および232をn
行のピクセルラベルで更新した後の処理の説明図であ
る。図19に示すように、垂直ラン230および232
はともに位置を1つシフトして、新しいラベルが垂直ラ
ンの指標位置1に挿入されている。垂直ランにより本シ
ステムは新しく処理した行を覚えることができ、また後
処理操作の精度も高くなる。これまで示してきたよう
に、本発明の実施の形態はコンピュータシステム上で実
行可能な特殊な「方法」および「方法機能」に関連す
る。
【0138】一般的な当業者であれば、これらの機能を
定義するコンピュータコードは、(a)書込み不能記憶
媒体上に恒久的に記憶された情報(例えば、コンピュー
タ内の読出し専用記憶装置またはコンピュータI/O付
属装置により読出し可能なCD−ROMディスク、
(b)書込み可能記憶媒体上に変更可能に記憶された情
報(例えば、フロッピーディスクおよびハードドライ
ブ)、または(c)電話網等の通信媒体を介してコンピ
ュータに伝送された情報を含む多様な形式でコンピュー
タに転送できるが、これらに制限されないことを容易に
評価すべきである。したがって、かかる媒体は、かかる
情報を備えているときには、本発明の別の実施形態を表
すものと理解すべきである。
【0139】本発明の好ましい実施の形態を説明してき
たので、一般的な当業者であれば、これらの好ましい実
施形態の概念を組み入れた他の実施の形態を使用できる
ことは明らかとなる。したがって、これら実施形態は、
開示された実施の形態のみに制限されるものではなく特
許請求の範囲によってのみ制限されるべきものである。
【図面の簡単な説明】
【図1】本発明の実施の形態に係る文書セグメント化を
実行するコンピュータ・システムのブロック図である。
【図2】図1に示すコンピュータシステムによる文書再
現システムのブロック図である。
【図3】図2に示すセグメント化プロセッサによる文書
セグメント化システムのブロック図である。
【図4】本発明の文書のセグメント化システムの処理の
流れ図である。
【図5】本発明の文書のセグメント化システムの処理の
流れ図である。
【図6】本発明の文書中の画像領域と大きなテキスト領
域の検出処理の流れ図である。
【図7】本発明の高解像度画像中の隣接部から低解像度
画像中の隣接部へのマッピングの説明図である。
【図8】本発明の記録媒体の白点と黒点の計算処理の流
れ図である。
【図9】本発明の記録媒体の白点と黒点の計算処理の流
れ図である。
【図10】本発明の文書のセグメント化の処理の流れ図
である。
【図11】本発明の文書のセグメント化の処理の流れ図
である。
【図12】本発明の所定数の連続画像行のためのRGB
値を含むバッファの略図である。
【図13】本発明のRGBバッファ内に記憶された画像
行のためのピクセルセグメント化ラベルを含むバッファ
の略図である。
【図14】本発明のカラーピクセル処理のために実行段
階を説明した流れ図である。
【図15】本発明の5×5カーネルのカラーラベルを有
するピクセルのシーケンスへの適用を表わす図である。
【図16】本発明の白ピクセルおよび黒ピクセルを後処
理するために実行する段階の流れ図である。
【図17】本発明の白ピクセルおよび黒ピクセルを後処
理するために実行する段階の流れ図である。
【図18】本発明の行内の1組のピクセルの位置のため
の垂直ランを示す図である。
【図19】本発明の行のピクセルラベルを付して更新し
た1組の垂直ランを示す図である。
【符号の説明】
10 コンピュータシステム 12 CPU 46、58 スキャナ 48 プリンタ 60 セグメント化プロセッサ 62 印刷システム 66 文書再現システム 68 画像および大きなテキスト検出器 70 白/黒点検出器 72 文書セグメント化装置 74 ハーフトーニング・システム
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 FI H04N 1/46 H04N 1/46 Z

Claims (38)

    【特許請求の範囲】
  1. 【請求項1】 複数のピクセルを有する混合文書をセグ
    メント化する方法において、画像ピクセルに対応する複
    数のピクセルの第1のピクセルを検出する段階と、大き
    なテキストピクセルに対応する複数のピクセルの第2の
    ピクセルを検出する段階と、その上に文書を印刷する媒
    体の白点に対応する第1の値を、第1のカラー空間内で
    計算する段階と、媒体の黒点に対応する第2の値を第1
    のカラー空間内で計算する段階と、媒体の白点のために
    補正される値のテーブルを第1の値を通して発生させる
    段階と、文書中の複数のピクセルのそれぞれを前記の値
    のテーブルを通してカラーラベル、黒ラベル、および白
    ラベルのいずれか1つでラベル付けする段階と、所定の
    ラベルと所定の長さを有するピクセル・シーケンスに複
    数の構文規則を適用する段階とを含むことを特徴とする
    文書セグメンント化方法。
  2. 【請求項2】 請求項1に記載の文書セグメント化方法
    において、複数のピクセルの第1のピクセルを検出する
    段階に先行して、さらに低分解度混合文書を発生させる
    段階を含むことを特徴とする文書セグメント化方法。
  3. 【請求項3】 請求項2に記載の文書セグメント化方法
    において,低分解度混合文書を発生させる段階がさら
    に、第1分解度を有する第1文書を提供するために第1
    回目のオリジナル文書を走査する段階と、第1分解度が
    第2分解度よりも低いような第2の異なる分解度を有す
    る第2文書を提供するために第2回目のオリジナル文書
    を走査する段階とを含むことを特徴とする文書セグメン
    ト化方法。
  4. 【請求項4】 請求項2に記載の文書セグメント化方法
    において、低分解度混合文書を発生させる段階がさら
    に、第1分解度を有する高分解度文書を提供するために
    スキャナで文書を走査する段階と、第2分解度が第1分
    解度よりも低い第2分解度を有する低分解度文書を供給
    するために第1回目に走査された文書をサブサンプリン
    グする段階とを含むことを特徴とする文書セグメント化
    方法。
  5. 【請求項5】 請求項2に記載の文書セグメント化方法
    において、さらに低分解度文書中で画像ピクセルをラベ
    ル付けする段階と、前記低分解度文書中で大きなテキス
    トピクセルをラベル付けする段階とを含むことを特徴と
    する文書セグメント化方法。
  6. 【請求項6】 請求項5に記載の文書セグメント化方法
    において、さらに混合文書の画像領域を画像ピクセルラ
    ベルおよび大きなテキストピクセルラベルを介して少な
    くとも1つの前景領域と少なくとも1つの背景領域に分
    割する段階と、テキスト領域に対応する少なくとも1つ
    の前景領域の第1部分および画像領域に対応する少なく
    とも1つの前景領域の第2部分を識別する段階とを含む
    ことを特徴とする文書セグメント化方法。
  7. 【請求項7】 請求項6に記載の文書セグメント化方法
    において、文書を分割する段階が低分解度文書中のピク
    セルを2水準しきい値量子化する段階を含むことを特徴
    とする文書セグメント化方法。
  8. 【請求項8】 請求項7に記載の文書セグメント化方法
    において、テキスト領域に対応する少なくとも1つの前
    景領域の第1部分および画像領域に対応する少なくとも
    1つの前景領域の第2部分を識別する段階が前記前景領
    域内の被接続成分を計算する段階と、前記前景領域内の
    被接続成分の境界ボックスを計算する段階とを含むこと
    を特徴とする文書セグメント化方法。
  9. 【請求項9】 請求項8に記載の文書セグメント化方法
    において、さらに少なくとも1つの前景領域のそれぞれ
    内の被接続成分の少なくとも1つのサイズを計算する段
    階と、少なくとも1つの前景領域のそれぞれ内の被接続
    成分の少なくとも1つの境界ボックスの寸法を計算する
    段階と、第1の所定領域値内に値を有する被接続成分の
    成分サイズおよび第2の所定領域値内に値を有する被接
    続成分の境界ボックスの寸法に応答して被接続成分内の
    ピクセルを大きなテキストピクセルとしてラベル付けす
    る段階とを含むことを特徴とする文書セグメント化方
    法。
  10. 【請求項10】 請求項7に記載の文書セグメント化方
    法において、さらに高分解度文書中に第1のラベルを有
    する第1ピクセル群を低分解度文書中に第1のラベルを
    有する第1ピクセルにマッピングする段階と、低分解度
    文書であってピクセルウィンドウが低分解度文書中の第
    1のピクセルを取り囲む低分解度文書中の第1のピクセ
    ルウィンドウを定義する段階と、前記低分解度文書中の
    第1のピクセルを取り囲むピクセルウィンドウ内に存在
    する第2の異なるラベルを有するピクセルに応答して、
    さらに低分解度文書中の第1のピクセルのラベルを第1
    のラベルから第2のラベルに変更する段階とを含むこと
    を特徴とする文書セグメント化方法。
  11. 【請求項11】 請求項10に記載の文書セグメント化
    方法において、第1のラベルが黒ラベルに対応しまた第
    2のラベルがカラーラベルに対応していることを特徴と
    する文書セグメント化方法。
  12. 【請求項12】 請求項1に記載の文書セグメント化方
    法において、低分解度文書中の混合文書の列に対応して
    いるピクセルシーケンスがピクセルウィンドウの中央に
    置かれることを特徴とする文書セグメント化方法。
  13. 【請求項13】 請求項1に記載の文書セグメント化方
    法において、ピクセルシーケンスが混合文書の行に対応
    することを特徴とする文書セグメント化方法。
  14. 【請求項14】 請求項1に記載の文書セグメント化方
    法において、第1カラー空間がRGBカラー空間であ
    り、白点がRGBカラー空間内のRGBトリプレットに
    対応し黒点がRGBカラー空間内のRGBトリプレット
    に対応し媒体が1枚の紙であることを特徴とする文書セ
    グメント化方法。
  15. 【請求項15】 混合カラー文書中のカラーラン長を後
    処理するための方法であって、前記混合カラー文書が複
    数のピクセルシーケンスを有しピクセルシーケンスのそ
    れぞれが複数のピクセルを有する方法において、 ピクセルのシーケンスを選択する段階と、選択したピク
    セルのシーケンスのラン長値を計算する段階と、選択し
    たピクセルのシーケンスのラン長値としきい値ラン長値
    とを比較する段階と、しきい値ラン長値よりも小さい選
    択したピクセルのシーケンスのラン長値に応答して複数
    の構文規則を選択したピクセルのシーケンスに適用する
    段階と、構文規則の少なくとも1つに応答して選択した
    ピクセルシーケンス内のピクセルのラベルを変更する段
    階を実行することと、少なくとも1つのピクセルラベル
    変更に応答して前記シーケンスのラン長値を計算する段
    階から前記ピクセルのラベルを変更する段階までを反復
    することとを含むことを特徴とする文書セグメント化方
    法。
  16. 【請求項16】 請求項15に記載の文書セグメント化
    方法において、さらにピクセルラベルの変更が無いこと
    に応答して次の複数のピクセルシーケンスのために、前
    記ピクセルのシーケンスを選択する段階より最後の前記
    すくなくとも1つのピクセルラベル変更に応答して行う
    反復処理までの段階を更に反復することを特徴とする文
    書セグメント化方法。
  17. 【請求項17】 混合カラー文書中の複数のピクセルシ
    ーケンスを処理する方法であって、前記ピクセルシーケ
    ンスのそれぞれがラベルを有する方法において、 複数のピクセルシーケンスから第1のピクセルシーケン
    スを選択する段階と、選択したピクセルのシーケンスの
    ラン長値を計算する段階と、選択したピクセルのシーケ
    ンスのラン長値としきい値ラン長値とを比較する段階
    と、しきい値ラン長値よりも小さい選択したピクセルの
    シーケンスのラン長値に応答して混合文書中のテキスト
    文字の先端に存在するカラーピクセル群を除去するため
    に構文規則をピクセルのシーケンスに適用する段階を実
    行することと、混合文書中の複数のピクセルシーケンス
    のそれぞれのために前記第1のピクセルシーケンスを選
    択する段階から前記構文規則をピクセルのシーケンスに
    適用する段階を反復する段階と、ピクセルシーケンス内
    の白ランが混合文書中の画像領域内にあることを決定す
    る段階と、混合文書中の画像領域内にある白ランに応答
    して白ランをカラーランに変更する段階と、ピクセルシ
    ーケンス内の黒ランが混合文書中の画像領域内にあるこ
    とを決定する段階と、混合文書中の画像領域内にある黒
    ランに応答して黒ランをカラーランに変更する段階とを
    含むことを特徴とする文書セグメント化方法。
  18. 【請求項18】 請求項17に記載の文書セグメント化
    方法において、白ランが画像領域内であることを決定す
    る段階が白ランに隣接するカラーランの長さを決定する
    段階と、白ランに隣接するカラーランの長さを所定のし
    きい値と比較する段階と、所定のしきい値よりも大きい
    白ランに隣接するカラーランの長さに応答して白ラン中
    のピクセルのそれぞれのラベルを白ラベルからカラーラ
    ベルに変更する段階と、選択した白ラン中のピクセルの
    それぞれについて輝度ピクセル値に対応する値を確認す
    る段階とを含むことを特徴とする文書セグメント化方
    法。
  19. 【請求項19】 請求項17に記載の文書セグメント化
    方法において、ピクセルシーケンスが垂直ピクセルシー
    ケンスおよび水平ピクセルシーケンスの第1のシーケン
    スに対応することを特徴とする文書セグメント化方法。
  20. 【請求項20】 請求項17に記載の文書セグメント化
    方法において、前記黒ランが混合文書中の画像領域内に
    あることを決定する段階および前記黒ランをカラーラン
    に変更する段階が、黒ランに隣接するカラーランの長さ
    を決定する段階と、黒ランに隣接するカラーランの長さ
    を所定のしきい値と比較する段階と、所定のしきい値よ
    りも大きい黒ランに隣接するカラーランの長さに応答し
    て黒ラン中のピクセルのそれぞれのラベルを黒ラベルか
    らカラーラベルに変更する段階とを含むことを特徴とす
    る文書セグメント化方法。
  21. 【請求項21】 請求項17に記載の文書セグメント化
    方法において、前記黒ランが混合文書中の画像領域内に
    あることを決定する段階および前記黒ランをカラーラン
    に変更する段階が、黒ランの左右それぞれ2つの直接隣
    接部のいずれかが白であることを決定する段階と、黒ラ
    ンの左右それぞれ2つの直接隣接部がいずれも白でない
    ことに応答して黒ラン中のピクセルのラベルを黒ラベル
    からカラーラベルに変更する段階とを含むことを特徴と
    する文書セグメント化方法。
  22. 【請求項22】 請求項17に記載の文書セグメント化
    方法において、混合文書中の複数のピクセルシーケンス
    それぞれについて、前記白ランが混合文書中の画像領域
    内にあることを決定する段階から前記黒ランをカラーラ
    ンに変更するまでの段階を反復する段階を含むことを特
    徴とする文書セグメント化方法。
  23. 【請求項23】 複数のピクセルを有する混合カラー文
    書を処理するための方法において、 混合カラー文書の大きなテキスト領域を識別する段階
    と、混合カラー文書の画像領域を識別する段階と、混合
    カラー文書の大きなテキスト領域内のピクセルを第1の
    ラベルでラベル付けする段階と、混合カラー文書の画像
    領域内のピクセルを第1のラベルでラベル付けする段階
    と、混合カラー文書中の残りの複数のピクセルのそれぞ
    れを第2ラベルおよび第3ラベルの最初のラベルでラベ
    ル付けする段階と、文書中のピクセルシーケンスを選択
    する段階と、選択したピクセルシーケンス内に第1の所
    定のラベルを有するピクセルのうちの所定のピクセルに
    第1の複数の構文規則を適用する段階とを含むことを特
    徴とする文書セグメント化方法。
  24. 【請求項24】 請求項23に記載の文書セグメント化
    方法において、さらに選択したピクセルシーケンス内に
    第2の所定のラベルを有するピクセルのうちの所定のピ
    クセルに第2の複数の構文規則を適用する段階を含むこ
    とを特徴とする文書セグメント化方法。
  25. 【請求項25】 請求項24に記載の文書セグメント化
    方法において、さらに選択したピクセルシーケンス内に
    第3の所定のラベルを有するピクセルのうちの所定のピ
    クセルに第3の複数の構文規則を適用する段階を含むこ
    とを特徴とする文書セグメント化方法。
  26. 【請求項26】 請求項24に記載の文書セグメント化
    方法において、第1のラベルがカラーラベルであり、第
    2のラベルが白ラベルであり、第3のラベルが黒ラベル
    であることを特徴とする文書セグメント化方法。
  27. 【請求項27】 請求項26に記載の文書セグメント化
    方法において、第1の複数の構文規則がカラーラベルを
    有するピクセルを妥当化するための規則に対応すること
    と、第1の所定のラベルがカラーラベルに対応すること
    を特徴とする文書セグメント化方法。
  28. 【請求項28】 請求項27に記載の文書セグメント化
    方法において、第2の複数の構文規則が白ラベルを有す
    るピクセルの妥当性を検査するための規則に対応するこ
    とと、第2の所定のラベルが白ラベルに対応することを
    特徴とする文書セグメント化方法。
  29. 【請求項29】 請求項28に記載の文書セグメント化
    方法において、第3の複数の構文規則が黒ラベルを有す
    るピクセルの妥当性を検査するための規則に対応するこ
    とと、第3の所定のラベルが黒ラベルに対応することを
    特徴とする文書セグメント化方法。
  30. 【請求項30】 文書をセグメント化するための装置に
    おいて、装置が文書の大きなテキスト領域を識別するた
    めの大きなテキスト領域の識別器と、文書の画像領域を
    識別するための画像領域識別器と、文書中の大きなテキ
    スト領域と画像領域内のピクセルを第1のラベルでラベ
    ル付けするためおよび文書中の残りの複数のピクセルの
    それぞれを第2ラベルおよび第3ラベルの最初のラベル
    でラベル付けするための文書セグメント化装置と、文書
    中のピクセルのシーケンスを選択するためのピクセルシ
    ーケンス選別器と、第1の複数の構文規則のうちの所定
    の構文規則を前記ピクセルシーケンス選別器によって選
    択されたピクセルシーケンス中に第1の所定のラベルを
    有するピクセルのうちの所定のピクセルに適用し、第1
    の複数の構文規則のうちの所定の構文規則を満足するピ
    クセルのピクセルラベルの妥当性を検査しまた第1の複
    数の構文規則のうちの所定の構文規則を満足しないピク
    セルのピクセルラベルを変更するためのピクセルラベル
    妥当性検査装置とを有することを特徴とする装置。
  31. 【請求項31】 請求項30に記載の装置において、さ
    らに入力ポートと出力ポートを有するプレビュー文書発
    生器を有し、前記プレビュー文書発生器が前記の大きな
    テキスト領域の識別器および前記画像領域識別器に結合
    されており、前記プレビュー文書発生器はその入力ポー
    トにおいて第1の分解度を有する文書を受信しまたその
    出力ポートにおいて第2の分解度が第1の分解度より低
    い第2の分解度を有する文書を供給することを特徴とす
    る装置。
  32. 【請求項32】 請求項31に記載の装置において、さ
    らに前記文書セグメント化装置に結合されたハーフトー
    ン印刷システムを有し、前記文書セグメント化装置が前
    記ハーフトーン印刷システムにセグメント化文書を供給
    することを特徴とする装置。
  33. 【請求項33】 カラー印刷システムにおいて、 スキャナカラー空間を有するスキャナであって前記スキ
    ャナが走査される混合カラー文書の受信に適応した入力
    ポートと混合カラー文書を表すビットのストリームを供
    給するための出力ポートを有するスキャナと、入力ポー
    トと出力ポートとを有する文書セグメント化システムで
    あって前記文書セグメント化装置がその入力ポートにお
    いて前記スキャナの出力ポートからディジタルビットの
    ストリームを受信しまたその出力ポートにおいてセグメ
    ント化された文書ビットストリームを供給するために前
    記文書セグメント化が、混合カラー文書の大きなテキス
    ト領域を識別するための大きなテキスト領域の識別器
    と、混合カラー文書の画像領域を識別するための画像領
    域識別器と、文書の大きなテキスト領域および画像領域
    内のピクセルを第1のラベルでラベル付けしまた文書中
    の残りの複数のピクセルのそれぞれを第2のラベルおよ
    び第3のラベルの第1のラベルでラベル付けするための
    文書セグメント化装置と、文書のピクセルのシーケンス
    を選択するためのピクセルシーケンス選別器と、第1の
    複数の構文規則のうちの所定の構文規則を前記ピクセル
    シーケンス選別器によって選択されたピクセルシーケン
    ス中の第1に所定のラベルを有するピクセルのうちの所
    定のピクセルに適用し、第1の複数の構文規則のうちの
    所定の構文規則を満足するピクセルのピクセルラベルの
    妥当性を検査しまた第1の複数の構文規則のうちの所定
    の構文規則を満足しないピクセルのピクセルラベルを変
    更するためのピクセルラベル妥当性検査装置とを含む文
    書セグメント化システムと、前記セグメント化プロセッ
    サの出力ポートに結合された入力ポートを有する印刷シ
    ステムであって、前記印刷システムがその入力ポートに
    おいてセグメント化された混合カラー文書を表すビット
    のストリームを受信し、また前記セグメント化システム
    から供給されたセグメント化文書のビットストリームに
    応答して混合カラー文書を印刷する印刷システムとを有
    することを特徴とするカラー印刷システム。
  34. 【請求項34】 請求項33に記載のカラー印刷システ
    ムにおいて、前記文書セグメント化システムがさらに前
    記スキャナの出力ポートに結合された入力ポートおよび
    前記大きなテキスト領域の識別器と前記画像領域識別器
    に結合された出力ポートを有するプレビュー文書発生器
    であって、前記プレビュー文書発生器がその入力ポート
    において第1の分解度を有する文書を受信し、またその
    出力ポートにおいて第2の分解度が第1の分解度より低
    い第2の分解度を有する文書を供給することを特徴とす
    るカラー印刷システム。
  35. 【請求項35】 スキャナ、プロセッサおよびプリンタ
    を含むカラー再現システムと共に使用するためのコンピ
    ュータプログラム製品において、 混合カラー文書の大きなテキスト領域と画像領域とを識
    別するためのコンピュータ読取り可能プログラムコード
    を有するコンピュータ使用可能媒体と、混合カラー文書
    の大きなテキスト領域と画像領域内のピクセルを第1の
    ラベルでラベル付けするためのコンピュータ読取り可能
    プログラムコードを有するコンピュータ使用可能媒体
    と、混合カラー文書中の残りの複数のピクセルのそれぞ
    れを第2ラベルおよび第3ラベルの第1のラベルでラベ
    ル付けするためのコンピュータ読取り可能プログラムコ
    ードを有するコンピュータ使用可能媒体と、混合カラー
    文書中のピクセルのシーケンスを選択するためのコンピ
    ュータ読取り可能プログラムコードを有するコンピュー
    タ使用可能媒体と、第1の複数の構文規則を選択された
    ピクセルシーケンス中に第1の所定のラベルを有するピ
    クセルのうちの所定のピクセルに適用するためのコンピ
    ュータ読取り可能プログラムコードを有するコンピュー
    タ使用可能媒体とを含むことを特徴とするコンピュータ
    プログラム製品。
  36. 【請求項36】 請求項35に記載のコンピュータプロ
    グラム製品において、さらに第2の複数の構文規則を選
    択されたピクセル行中に第2の所定のラベルを有するピ
    クセルのうちの所定のピクセルに適用するためのコンピ
    ュータ読取り可能プログラムコードを有するコンピュー
    タ使用可能媒体を含むことを特徴とするコンピュータプ
    ログラム製品。
  37. 【請求項37】 請求項35に記載のコンピュータプロ
    グラム製品において、さらに第3の複数の構文規則を選
    択されたピクセルシーケンス中に第3の所定のラベルを
    有するピクセルのうちの所定のピクセルに適用するため
    のコンピュータ読取り可能プログラムコードを有するコ
    ンピュータ使用可能媒体を含むことを特徴とするコンピ
    ュータプログラム製品。
  38. 【請求項38】 請求項36に記載のコンピュータプロ
    グラム製品において、さらに第1の分解度を有する文書
    を受信して第2の分解度が第1の分解度より低い第2の
    分解度を有する文書を発生するためのコンピュータ読取
    り可能プログラムコードを有するコンピュータ使用可能
    媒体を含むことを特徴とするコンピュータプログラム製
    品。
JP9183525A 1996-07-12 1997-07-09 文書セグメント化方法、装置、カラー印刷システムおよびコンピュータプログラム製品 Pending JPH1091792A (ja)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US2167496P 1996-07-12 1996-07-12
US08/782,144 1996-07-12
US60/021,674 1996-07-12
US08/782,144 US5956468A (en) 1996-07-12 1997-01-10 Document segmentation system

Publications (1)

Publication Number Publication Date
JPH1091792A true JPH1091792A (ja) 1998-04-10

Family

ID=26694993

Family Applications (1)

Application Number Title Priority Date Filing Date
JP9183525A Pending JPH1091792A (ja) 1996-07-12 1997-07-09 文書セグメント化方法、装置、カラー印刷システムおよびコンピュータプログラム製品

Country Status (1)

Country Link
JP (1) JPH1091792A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100484170B1 (ko) * 2002-10-25 2005-04-19 삼성전자주식회사 디지털 화질 개선방법 및 장치
KR100514734B1 (ko) * 2002-08-22 2005-09-14 삼성전자주식회사 디지털 화질 개선방법 및 장치
JP2007230209A (ja) * 2006-01-31 2007-09-13 Dainippon Printing Co Ltd 熱転写記録装置及び画像形成方法
JP2023511791A (ja) * 2020-04-10 2023-03-22 キヤノン オイローパ エヌ.ヴェー. テキスト分類

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100514734B1 (ko) * 2002-08-22 2005-09-14 삼성전자주식회사 디지털 화질 개선방법 및 장치
KR100484170B1 (ko) * 2002-10-25 2005-04-19 삼성전자주식회사 디지털 화질 개선방법 및 장치
JP2007230209A (ja) * 2006-01-31 2007-09-13 Dainippon Printing Co Ltd 熱転写記録装置及び画像形成方法
JP2023511791A (ja) * 2020-04-10 2023-03-22 キヤノン オイローパ エヌ.ヴェー. テキスト分類

Similar Documents

Publication Publication Date Title
US5956468A (en) Document segmentation system
US6275304B1 (en) Automated enhancement of print quality based on feature size, shape, orientation, and color
US6504949B2 (en) Image processing apparatus and method
DE69118939T2 (de) Bildverarbeitungsgerät
US7116443B2 (en) Neutral pixel detection using color space feature vectors wherein one color space coordinate represents lightness
EP0881822B1 (en) Luminance-based color resolution enhancement
KR100405226B1 (ko) 다중레벨복수컬러입력이미지재생방법
US6377711B1 (en) Methods and systems for detecting the edges of objects in raster images using diagonal edge detection
JPH10108022A (ja) ハーフトーン・イメージ・データ獲得方法と装置およびハーフトーン印刷方法と装置
JPH1051632A (ja) 複合モードの文書の品質を向上させるための方法及び装置
JPH07168948A (ja) 文書イメージ品質改善方法
JP2002185800A (ja) 適合画像強調フィルター及び強調画像データの生成方法
US6718059B1 (en) Block selection-based image processing
US6509903B1 (en) System and method for recording an image
US6125200A (en) Removing non-text information from a color image
US5930385A (en) Apparatus and method for image conversion
US6437872B1 (en) Multibit screening of print documents in a PDL environment
KR20000005016A (ko) 화상 인식 방법 및 장치와, 이를 사용한 복사기 및 프린터
US6661921B2 (en) Image process apparatus, image process method and storage medium
JPH05233786A (ja) 異なるデータ型のインテリジェント後処理が可能な方法及び装置
US5485529A (en) Image processing apparatus with the ability to suppress isolated points
JPH1091792A (ja) 文書セグメント化方法、装置、カラー印刷システムおよびコンピュータプログラム製品
US6947595B2 (en) System for processing object areas of an image
US6356360B1 (en) Apparatus and method for rendering halftone dot structures using grey level dots
JP2006109482A (ja) 画像処理方法、画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060714

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060714

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060829