JP2001274990A

JP2001274990A - 画像処理方法及び装置

Info

Publication number: JP2001274990A
Application number: JP2000376263A
Authority: JP
Inventors: Yuki Uchida; 由紀内田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1999-12-10
Filing date: 2000-12-11
Publication date: 2001-10-05
Anticipated expiration: 2020-12-11
Also published as: JP4405663B2; US6718059B1

Abstract

(57)【要約】（修正有）【課題】カラー複写機等に適用される正確で安価な画像
処理システムを提供する。【解決手段】画像処理システムは、イメージデータの入
力と、入力したイメージデータ内の画素のタイプを判断
するための、該イメージデータに対するブロックセレク
ション処理の実行と、前記ブロックセレクション処理に
基づいて注目画素データがテキスト画素を表すかどうか
を判断する第１判断ステップと、この注目画素データが
エッジ画素を表すかどうかを判断する第２判断ステップ
と、注目画素がテキスト画素及びエッジ画素を表すと判
断された場合の、該注目画素に対する第１の処理の実行
と、前記注目画素がテキスト画素及びエッジ画素を表す
と判断されなかった場合の、該注目画素に対する第２の
処理の実行を含む。

Description

【発明の詳細な説明】

【０００１】

【発明の分野】本発明は画素データを処理するシステム
に関する。更に詳しくは、本発明は、入力された画素デ
ータの検出された特徴に基づいて画素データが処理され
る画像処理システムに関する。

【０００２】

【参照による組み込み】本願と共通の譲り受け人によ
る、米国特許第5,680,479号（名称は「文字認識方法及
び装置」、米国特許出願番号07/873,012）と、米国特許
第5,588,072号（名称は「格納されたドキュメントにお
けるテキスト及び・又は非テキストブロックを選択する
ための方法及び装置、米国特許出願番号08/171,720）
と、米国特許出願第08/338,781（名称は「ページ解析シ
ステム」）と、米国特許第5,774,579号（名称は「オー
バラップするブロックが分解されるブロックセレクショ
ンシステム」、米国特許出願番号08/514,250）と、米国
特許第5,848,186号（名称は「特徴抽出システム」、米
国特許出願番号08/514,252）と、米国特許出願番号08/6
64,674（名称は「付属されたテキストを抽出するシステ
ム」）と、米国特許出願番号08/751,677（名称は「ペー
ジ解析システム」）と、米国特許第5,825,944号（名称
は「ブロックセレクションのレビュー及び編集システ
ム、米国特許出願番号08/834,856）と、米国特許出願番
号09/002,684（名称は「テーブルイメージの解析システ
ム」）と、米国特許出願番号09/161,716（名称は「カラ
ーブロックセレクション」）と、米国特許出願番号09/2
22,860（名称は「テーブル特徴のブロックセレクショ
ン」）とは、その全てが記載されているものとして本願
に組み込まれる。

【０００３】

【背景技術の説明】カラー複写機のような一般的な画像
処理システムは、原稿文書を走査することによって画素
データを取得し、レーザビーム方式の再生エンジンや、
インクジェット方式の再生システム等への受け渡しに適
した出力データを生成するために、そのデータに対して
種々の画像処理ステップを実行する。特に、一般的な画
像処理システムでは、たとえば「画像処理装置及び方
法」という名称の米国特許第（CFM595US)に記載されて
いるように、まず、電化結合素子（ＣＣＤ）から走査さ
れた画像を表す赤（Ｒ）、緑（Ｇ）及び青（Ｂ）の信号
が受信される。受信された信号は、次いで、画像処理に
提供される。

【０００４】図１はそのような画像処理を説明する図で
ある。図１に示されるように、ＣＣＤから出力された画
像信号はアナログ信号処理ユニット１０１に入力され
る。ここで、その信号は、ゲイン及びオフセットが調整
される。次に、Ｒ，Ｇ及びＢの各信号は、Ａ／Ｄ変換器
１０２によって、それぞれ８ビットのデジタル画像信号
Ｒ１，Ｇ１及びＢ１に変換される。そして、これらの信
号は、シェーディング補正回路１０３に入力され、各信
号に対してシェーディング補正が適用される。ライン遅
延回路１０４及び１０５はＣＣＤ内のセンサを空間的に
補償するのに用いられる。この補償により、Ｒ１，Ｇ１
及びＢ１の各信号間のタイミングを整合させ、ライン遅
延回路１０５以降では、同時刻におけるＲ，Ｇ及びＢの
信号が同一画素を表すようになる。

【０００５】入力マスキングユニット１０６は、ＣＣＤ
の色分解特性によって決定される読み取り色空間を、標
準の色空間に変換する。ログ変換器１０７は輝度信号Ｒ
４，Ｇ４及びＢ４を濃度信号Ｃ０，Ｍ０及びＹ０に変換
する。そして、ＵＣＲ（下色除去）、ＦＩＬＴＥＲ及び
ＳＥＮの各信号が生成されて決定されるまでの間、濃度
信号はライン遅延メモリ１０８によって遅延される。

【０００６】ライン遅延メモリ１０８による信号の遅延
の後に、マスキングＵＣＲ回路１０９はＵＣＲ信号を用
いて上記濃度信号から黒信号を抽出する。可変変倍回路
１１０は主走査方向に、画像信号及び黒文字判定信号を
拡大、縮小する。空間フィルタ処理ユニット１１１は、
ＦＩＬＴＥＲ信号を用いてフィルタリングを実行し、そ
の結果として得られるフレーム順の画像信号Ｍ４，Ｃ
４，Ｙ４及びＢｋ４が、ＳＥＮ信号とともに再生エンジ
ン１１２に送られる。ここで、ＳＥＮは、画像出力され
る際の解像度を決定する。

【０００７】上記出願（CFM595US）によれば、上記ＵＣ
Ｒ、ＦＩＬＴＥＲ及びＳＥＮ信号は、黒文字検出ユニッ
ト１１５より出力される。特に、黒信号検出ユニット１
１３によって生成されたＵＣＲ信号は、黒から薄くなる
順に０〜７の値を有し、マスキングＵＣＲ回路１０９が
黒信号Ｂｋ２を生成するために、信号Ｙ１，Ｍ１及びＣ
１から除去するべき黒成分の量を示す。黒文字判定回路
１１３によって生成されたＦＩＬＴＥＲ信号は、スムー
ジング、強エッジ強調、中エッジ強調、弱エッジ強調の
それぞれを表す値０，１，２及び３を示す２ビット値で
ある。したがって、ＦＩＬＴＥＲ信号は、信号Ｙ３，Ｍ
３，Ｃ３及びＢｋ３に適用されるフィルタリングの度合
い及びタイプを制御するために、空間フィルタ処理ユニ
ット１１１に入力される。

【０００８】ＳＥＮ信号は黒文字判定回路１１３から再
生エンジン１１２に出力される。このＳＥＮ信号におい
て、値０は２００ライン／インチでプリントを処理する
ことを示し、値１は、４００ライン／インチのプリント
処理を要求することを示す。

【０００９】ＵＣＲ，ＦＩＬＴＥＲ及びＳＥＮの値はル
ックアップテーブル（ＬＵＴ）１１７の出力である。Ｌ
ＵＴ１１７は、注目画素を含む文字の幅、注目画素の文
字のエッジへの近接度、注目画素の色度を表す信号を受
信する。したがって、ＵＣＲ，ＦＩＬＴＥＲ及びＳＥＮ
の各出力値は各注目画素について計算され、ＬＵＴによ
って特定される関係に従って、その画素に対応して検出
された文字幅、エッジ近接度及び色度に基づいて決定さ
れる。

【００１０】たとえば、ＦＩＬＴＥＲ信号値１は、エッ
ジの近くに配置され、低い色度を有し、比較的細い文字
に含まれるような注目画素について用いられる。そのよ
うなファクタは、その画素が小さな、黒文字内にあるこ
とを示すからである。他の例において、その注目画素が
エッジの近くではなく、非常に濃い領域に含まれている
場合、ＳＥＮ信号に値０（２００ライン／インチの解像
度に対応）が割り当てられる。大きなドットよりも単位
ユニット領域あたりにより多くのトナーを提供する、よ
り大きなトナードットが、より良好なハーフトーンイメ
ージを生成するからである。

【００１１】上述からわかるように、米国特許出願（Ｃ
ＦＭ５９５ＵＳ）に記載されているような、一般的な画
像処理システムは、画素に対する適切な処理パラメータ
を決定するために、いくつかのファクターに基づいて注
目画素の性質を「推測」する。そのようなアプローチの
ひとつの短所は、推測された性質が間違っていた場合、
その画素に不適切な処理が実行されてしまうことであ
る。

【００１２】上記に鑑み、必要であることは、入力画像
データの正確で安価に、検出された属性を使用してイメ
ージ処理を改良する画像処理システムである。

【００１３】

【発明の要約】本発明は、注目画素のデータに適用さ
れるべき処理を決定するためにブロックセレクション処
理の結果を利用することによって、上述の問題に対処す
るものである。このように、ブロックセレクション処理
の結果を用いることで、上述した一般的なシステムを用
いる場合よりも注目画素の性質をより具体的に特定する
ことができる。従って、より適切な処理が画素データに
適用され得る。加えて、既存のイメージ処理ハードウェ
アと組み合わせて、そのようなブロックセレクション処
理を用いることにより、イメージ処理は高速に進む。そ
の上、ブロックセレクション処理は、好ましくはソフト
ウエアベースであり、それゆえ、安価に実行できる。

【００１４】特に、本発明は、イメージデータを入力
し、入力したイメージデータ内の画素のタイプを判断す
るために、当該イメージデータに対してブロックセレク
ション処理が実行され、前記ブロックセレクション処理
に基づいて、注目画素データがテキスト画素を表すかど
うかが判断され、更にその注目画素データがエッジ画素
を表すかどうかが判断される、画像処理システムを指向
するものである。そして、その注目画素がテキスト画素
及びエッジ画素を表すと判断された場合に、該注目画素
に第１の処理が実行され、その注目画素がテキスト画素
及びエッジ画素を表すと判断されなかった場合には、該
注目画素に第２の処理が実行される。

【００１５】上記構成によれば、安価な、適切な画像処
理が画像データに対して適用される。たとえば、上記第
１の処理は好ましくはシャープ化処理であり、前記第２
の処理が好ましくはスムージング処理である。

【００１６】本発明の更なる態様において、上記入力ス
テップは、第１の解像度でイメージデータ予備走査し、
上記第１の解像度よりも高い第２の解像度でイメージデ
ータを走査する。そして、上記ブロックセレクション処
理は上記第１の解像度におけるイメージデータについて
実行され、シャープ化処理とスムージング処理は第２の
解像度におけるイメージデータについて実行される。こ
の更なる態様は、全体の処理が迅速に完了することを可
能とする。

【００１７】なお、本発明は、画素データのタイプが、
ハーフトーンのテキスト、ラインアート、ライン、タイ
トル、テーブル、ハーフトーン、フレーム及び背景であ
ることを判断することを考慮する。従って、適切な画像
処理がこれら画素データタイプに基づいて適用され得
る。

【００１８】本要約は、本発明の性質が迅速に理解され
るように提供されたものである。本発明のより完全な理
解は、いかに添付図面に関連してなされた本実施形態の
詳細な説明を参照することによりなされ得る。

【００１９】

【発明の実施の形態】図２は本発明に係る一実施形態に
よる画像処理装置の断面を示す図である。図２の装置に
おいて、イメージスキャナ２０１は原稿文書を読み取
り、読み取った原稿の画素データにデジタル処理を施し
てディジタル信号とする。プリンタ２１８は、イメージ
スキャナ２０１によって読み取られた原稿文書に対応す
るイメージを、印刷用紙上にフルカラーでプリントす
る。

【００２０】イメージスキャナ２０１において、原稿文
書２０４はプラテンガラス上にセットされ、原稿カバー
２０２でもってカバーされ、ハロゲンランプ２０５によ
って露光される。原稿文書２０４からの反射光は、更に
ミラー２０６及び２０７によって反射され、レンズ２０
８を通過した後に、Ｒ，Ｇ及びＢ信号を特定するための
ＣＣＤ２１０にフォーカスする。なお、レンズ２０８は
赤外線フィルタ２３１によってカバーされている。

【００２１】好ましい実施形態において、それぞれの色
成分を読み取るためのＣＣＤ２１０における各センサの
行は、５０００画素からなる。こうして、ＣＣＤ２１０
は、Ａ３サイズの短辺長、すなわち２９７ｍｍの長さに
渡って、４００ｄｐｉの解像度で読み取ることができ
る。ＣＣＤ２１０は原稿文書のカラー情報を、Ｒ，Ｇ及
びＢの色成分のフルカラー情報へ分離し、そのフルカラ
ー情報を色信号へ変換する。

【００２２】更に、標準白板２１１は、ＣＣＤ２１０の
Ｒ，Ｇ，Ｂフォトセンサ２１０−１〜２１０−３による
読み取りデータを校正するための校正データを生成す
る。この標準白板２１１は、可視光領域において均一な
反射特性を有しており、白色に見える。データを校正し
た後、ＣＣＤ２１０は信号を信号処理ユニット２０９へ
送る。

【００２３】なお、ハロゲンランプ２０５とミラー２０
６は速度ｖで移動し、ミラー２０７は速度１／２ｖで移
動する。これらの移動方向は、ＣＣＤ２１０の電気的走
査方向（主走査方向）に対して直角な方向である。原稿
文書２０４の全領域は、この方法で走査される。

【００２４】更に、信号処理ユニット２０９において、
読み取り信号は電気的に処理され、マゼンタ（Ｍ）、シ
アン（Ｃ）、イエロー（Ｙ）及び黒（Ｂｋ）の色成分に
分離され、プリンタ２１８に送られる。イメージスキャ
ナ２０１による各走査動作に対して、色成分データＭ，
Ｃ，Ｙ及びＢｋのうちの一つがプリンタ２１８に送られ
る。こうして、原稿文書２０４を４回走査することによ
って、一つのカラー画像が形成される。

【００２５】プリンタ２１８において、イメージスキャ
ナ２０１からのＭ，Ｃ，Ｙ及びＢｋの各色信号は、レー
ザドライバ２１２に送られる。レーザドライバ２１２
は、画像信号に基づいて変調された信号によって半導体
レーザ２１３を駆動する。レーザビームは、ポリゴンミ
ラー２１４、ｆ−θレンズ２１５及びミラー２１６を介
して、静電ドラム２１７を走査する。

【００２６】現像ユニットはマゼンタ現像器２１９、シ
アン現像器２２０、イエロー現像器２２１、及び黒現像
器２２２からなる。これら４つのドラムは、静電ドラム
２１７と接触し、それによって回転し、静電ドラム２１
７上に形成されたＭ，Ｃ，Ｙ及びＢｋの潜像を対応する
色のトナーで現像する。更に、転写ドラム２２３は、用
紙カセット２２４或いは２２５から供給された記録紙を
吸着して、静電ドラム２１７上に現像されたトナーイメ
ージをその用紙上に転写させる。そしてその用紙は、定
着ユニット２２６を通過した後に排出される。

【００２７】図３は本発明に従った画像処理フローを示
すブロック図である。図３に示される構成で、図１に示
したのと同一の参照番号を有するものは、図１に関して
上述したように動作する。さて、図３では、フォントサ
イズと属性を表す信号を出力するブロックセレクション
ユニット２００が示されている。ブロックセレクション
ユニット２００は、図３においてハードウエアユニット
として示されているが、ここで説明されるブロックセレ
クション処理と、ここで参照によって組み込まれるアプ
リケーションにおいて説明されるブロックセレクション
処理は、ソフトウエアによって実現されてもよいし、ソ
フトウエアとハードウエアのコンビネーションによって
実現されてもよい。更に、ブロックセレクションユニッ
ト２００は黒文字検出ユニット１１３のエレメントでな
くともよい。

【００２８】動作において、ブロックセレクションユニ
ット２００は入力された画像データに対してブロックセ
レクション処理を実行し、そのデータ内のオブジェクト
の属性とともに、そのデータ内のテキストのフォントサ
イズを決定する。更に詳細には、ブロックセレクション
ユニット２００は、入力された画像データの各画素に対
してその画素が配置されているオブジェクトの属性を割
り当てるとともに、もしその画素がテキスト内にあるの
ならば当該テキストのフォントサイズを割り当てる。

【００２９】また、図３には、ＬＵＴ１１７とは異なる
内容を有するＬＵＴ２０５が示されている。ＬＵＴ２０
５について概要を述べれば、ＬＵＴ２０５はフォントサ
イズ（font size）、属性（attribute）、エッジ（edg
e）及びｃｏｌを入力信号とし、ＵＣＲ，ＦＩＬＴＥＲ
及びＳＥＮを出力信号とするものである。ＬＵＴ２０５
の詳細な内容は後述する。

【００３０】図４は、本発明に従って画素データを処理
する処理ステップのフローチャートである。フローはス
テップＳ４０１から始まり、ここでまず、文書が低解像
度でスキャンされる。好適な実施形態においては、図２
に関して上述したように、そのようなスキャニングがイ
メージスキャナ２０１によって実行されることになる。
もちろん、ステップＳ４０１において、文書をスキャン
するための他のシステムを用いることも可能である。一
般的に低解像度のスキャンは高解像度のスキャンよりも
より高速に動作するので、ステップＳ４０１において
は、処理時間を減らすために文書が低解像度でスキャン
される。加えて、出願人は、低解像度画素データは、こ
れに続くブロックセレクション処理に供された場合に満
足の行く結果をもたらすことを見出している。

【００３１】図５は、ステップＳ４０１においてスキャ
ンされ得る文書例を示す図である。文書２１０は、タイ
トル２１１、水平のライン２１２、テイスト領域２１
４、画像領域２１５、線画領域２１６及び表２１７を含
んでいる。ブロックセレクション処理は、他の多くのタ
イプとともに、これらの分離されたオブジェクト領域の
各タイプを特定する。

【００３２】ステップＳ４０２において、ブロックセレ
クション処理は、スキャンされた文書内に配置されたオ
ブジェクトの属性及びテキストのフォントサイズを検出
する。一般的なブロックセレクション技術（或いはペー
ジ分割（page segmentation）技術）がステップＳ４０
２に用いられ得る。また、上記においてリストアップ
し、本願に参照として組み込まれている特許出願におい
て記載されているような技術も含まれる。

【００３３】一般に、ブロックセレクション処理は画像
内のオブジェクトを特定し、その特定されたオブジェク
トに対して、ピクチャ、テキスト、タイトル、表、線画
等のような属性を割り当てる。上記のリストに上げた出
願に記載されているように、他の多くのタイプの属性が
特定されたオブジェクトに割り当てられてもよい。ま
た、オブジェクトの特定において、本発明に従って用い
られるブロックセレクション処理技術は、テキストオブ
ジェクト内の個々のテキスト文字のサイズを検出する。

【００３４】本発明において使用可能なブロックセレク
ション技術の一つの例として、米国特許第5,680,479号
に記載されているものがあげられる。この技術を用い
て、画像内において特定されたオブジェクトは、サイズ
情報とともに、オブジェクトのタイプ（たとえばテキス
ト、ピクチャ、表等）を特定する属性が割り当てられ
る。図１３は、この技術に従ったブロックセレクション
を実行する処理ステップのフローチャートである。図１
３の各処理ステップは、ハードウエアで実現されても、
ソフトウエア或いはハードウエアとソフトウエアのコン
ビネーションによって実現されてもよい。

【００３５】ここで記述される処理ステップがソフトウ
エアによって実現される場合には、読み出し専用メモリ
（ＲＯＭ）に格納されたコンピュータプログラムに従っ
て中央処理装置（ＣＰＵ）がこれらを実行することにな
る。読み書き可能なメモリ（ＲＡＭ）が、入力画像デー
タ、処理画像データ、画像の構造に関する情報等を格納
するのに用いられ得る。ＣＰＵは、ＲＯＭ、ＲＡＭ及び
入出力デバイス（たとえば、ディスクメモリ、プリンタ
／ディスプレイ、スキャナ等）に、バスを介して接続さ
れている。

【００３６】簡潔に述べれば、接続されたコンポーネン
ト（以下、接続コンポーネント）を検出し、その接続コ
ンポーネントをそれらのサイズ、及び他の接続コンポー
ネントとの相対的な位置に従って分類するべく、画像が
解析される。接続コンポーネントは、白画素によって完
全に囲まれた黒画素ブロックのグループである。従っ
て、接続コンポーネントとは、少なくとも一つの白画素
によって他の黒画素グループから完全に分離されている
グループである。はじめに、各接続コンポーネントは、
テキストユニットか非テキストユニットに分類される。
接続コンポーネントの組織的データを提供するために、
階層ツリー構造が形成される。

【００３７】ステップＳ１３０１において、画素画像デ
ータ中の接続コンポーネントは、輪郭追跡によって検出
される。輪郭追跡は、図１４Ａにおいて示されるように
画像データを走査することによって進められる。走査
は、画像の右下部分から左へと矢印Ａによって示される
ように進められ、画像の右側境界に遭遇すると、上方へ
と進む。走査は、他の方向に進むようにしてもよい。た
とえば、左上から右下へと進んでもよい。黒画素に遭遇
したとき、隣接する画素について、その黒画素に隣接す
る画素もまた黒であるかどうかが、３１に示される星型
状のパターンの順で調べられる。星型バースト状パター
ン３１が共通の中心から放射状に伸びる８個のベクトル
を含むので、この輪郭追跡を、以降、「８方向」追跡と
称する。隣接した黒画素が見つかった場合は、画像の外
輪郭が追跡され終わるまで、上述したように処理が続け
られる。こうして、図１４Ｂに示されるように、矢印Ａ
の方向における走査は文字「Ｑ」の尻尾部分に対応する
ポイント３２を見つける。文字「Ｑ」の外輪郭が追跡さ
れるように、隣接画素の検査が星型バースト状パターン
３１に従って進む。なお、閉じた輪郭の内側部分は追跡
されない。

【００３８】一つの接続コンポーネントが検出され、８
方向追跡によってその輪郭が追跡された後、走査は次の
黒画素が見つかるまで進められる。同様にして、手書き
の単語「非テキスト（non-text）」である非テキストオ
ブジェクト３５が追跡される。その追跡は、単語「テキ
スト（text）」を形成する各文字であるテキストオブジ
ェクト３６中の個々の文字と同様である。図１４Ａに示
される走査は、画素データ中のすべての接続コンポーネ
ントが検出され、８方向追跡によってそれらの輪郭が検
出されるまで続けられる。

【００３９】処理は、ステップＳ１３０２に進み、各接
続コンポーネントが矩形化される。特に、可能な限り最
小の外接矩形が、各接続コンポーネントの周りに描画さ
れる。こうして、図１４Ｂに示されるように、矩形３７
がオブジェクト３２の周りに描画され、矩形３９はオブ
ジェクト３４の周りに描画され、矩形４０はオブジェク
ト３５の周りに描画され、そして、矩形４１ａ、４１
ｂ、４１ｃ及び４１ｄがテキストオブジェクト３６ａ、
３６ｂ、３６ｃ及び３６ｄの周りにそれぞれ描画され
る。

【００４０】ステップＳ１３０３において、ツリー上の
位置が各矩形ユニットに対して割り当てられる。大部分
に関して、ステップＳ１３０３で取得されたツリー構造
においては、画素画像における各オブジェクトに関し
て、ツリーのルートから直接に進んでくる。これは、接
続コンポーネントの外輪郭のみが追跡され、閉じた輪郭
の内側部分は追跡されないからである。

【００４１】こうして図１４Ｃに示されるように、接続
コンポーネント３２に対応する矩形３７はそのページの
ルートから直接に出てくる。しかしながら、非テキスト
オブジェクト３５に対応する矩形４０、テキストオブジ
ェクト３６ａ及び３６ｂに対応する矩形３６ａ及び３６
ｂのような、その矩形が完全に別の接続コンポーネント
内に存在してしまう接続コンポーネントに関して、それ
らの接続コンポーネントは、それを囲む接続コンポーネ
ント（この場合、コンポーネント３４）からの子孫とし
て示されている。加えて、少なくとも一つの子孫を持つ
各接続コンポーネントは、たとえばコンポーネント３４
であるが、そのコンポーネント自身は、それ自身からの
「主要な子孫」として示される。

【００４２】こうして、図１４Ｃにおいて示されるよう
に、コンポーネント３９は、コンポーネント３９の他の
子孫４０、４１ａ及び４１ｂの中の主要な子孫として含
まれる。ステップＳ１３０４において、ツリーの第１レ
ベルの接続コンポーネントの各々は、テキストユニット
か或いは非テキストユニットのいずれかに分類される。
この分類は２つのステップを経てなされる。まず第１の
ステップにおいて、接続コンポーネントに対する矩形が
所定のサイズ閾値と比較される。その接続コンポーネン
トを囲む矩形の高さが、予期される最大のフォントサイ
ズに対応する第１の所定の閾値よりも大きい場合、或い
は、その接続された輪郭を囲む矩形の幅が、ページを経
験的に決定された定数（「５」が満足のいく結果をもた
らすことが見出されている）によって分割して得られる
幅よりも広い場合、その接続コンポーネントは非テキス
トユニットとして分類され、当該ユニットに非テキスト
属性が付与される。

【００４３】第２のステップにおいて、すべての残りの
ユニット、すなわち、まだ非テキストとして分類されて
いないユニットが、すべての残りの接続コンポーネント
について集めたサイズに基づいて適応的に決定された閾
値と比較される。具体的には、非テキストユニットとし
て決定されていないすべての矩形の高さが平均される。
この平均高さは、スカラー量（好適には「２」が選択さ
れる）によって乗算され、適応的に決定された閾値が得
られる。そして、この適応的に決定された閾値よりも大
きいすべてのユニットが、非テキストであると推定され
る。従って、他方の、当該適応的に決定された閾値より
も小さいすべてのユニットはテキストであると推定され
る。このようにしてユニットは分類され、適当な属性が
付与される。そして、これらの分類の両方が、図１３の
残りの部分において示され、以下においてより完全に説
明されるような精錬処理を受ける。

【００４４】ツリー構造の第１のレベルにおける各ユニ
ットがテキスト或いは非テキストに分類された後、テキ
ストユニットの全ての子孫（主要な子孫を含めて）が、
まずテキストユニットに分類される。また、非テキスト
ユニットにおいてその主要な子孫の分類は非テキストと
して維持されるが、非テキストユニットのすべての他の
子孫はテキストユニットに分類される。

【００４５】ステップＳ１３０５において、第１ユニッ
トが選択される。ステップＳ１３０６において、そのユ
ニットがテキストユニットであった場合、フローはステ
ップＳ１３０７へ進み、次のユニットが選択される。フ
ローにおいて、ステップＳ１３０６及びＳ１３０７が、
非テキストユニットが選択されるまで続行される。非テ
キストユニットが選択されると処理はステップＳ１３０
８へ進む。

【００４６】ステップＳ１３０８において、その非テキ
ストユニットが検査され、当該ユニットからの子孫があ
るかどうかが判断される。たとえば、図１４Ｃに示され
るように、非テキストユニット３９は非テキストの主要
な子孫３９と、テキスト子孫４０、４１ａ及び４１ｂを
含む。ステップＳ１３０８において子孫が存在した場合
は、フローはステップＳ１３０９へ進む。ステップＳ１
３０９において、ユニットはフィルター処理され、その
ユニットがハーフトーン（或いはグレースケール）であ
るかどうかが判断される。ハーフトーンフィルタリング
において、ユニットの子孫が検査され、「ノイズ」サイ
ズよりも小さいサイズを有する子孫の数が判断される。
「ノイズサイズ」のユニットは、その高さが、画像デー
タとして期待される最小のフォントサイズよりも小さい
ものである。ノイズサイズよりも小さいサイズの子孫の
数が子孫の全数の半分よりも大きい場合は、そのユニッ
トはハーフトーンイメージであると判定される。従っ
て、ステップＳ１３１０において、フローはステップＳ
１３１１に進み、「ハーフトーン」属性がそのユニット
に付与される。その後、ステップＳ１３１２では、その
ハーフトーンイメージ中に組み込まれたあらゆるテキス
トがチェックされる。具体的には、ハーフトーンイメー
ジのテキストサイズの子孫の各々のツリー構造は、その
テキストサイズのユニットがもはやハーフトーンイメー
ジからの子孫ではなく、ハーフトーンイメージと同じレ
ベルであるように、変更される。これは、そのようなも
のが適切であると思われるならば、ハーフトーンイメー
ジにおけるテキストサイズのユニットの文字認識を可能
とする。その後、フローはステップＳ１３０７に戻り、
次のユニットが処理のために選択される。

【００４７】ステップＳ１３０９において、ハーフトー
ンフィルタリングが、そのユニットはハーフトーンイメ
ージでないと判断した場合、フローはステップＳ１３１
０を経てステップＳ１３１３に進む。ステップＳ１３１
３において、そのユニットの主要な子孫が更なる処理の
ために選択される。そして、フローはステップＳ１３１
４に進む。

【００４８】ステップＳ１３０８において非テキストユ
ニットが子孫を持っていないと判断された場合、或いは
ステップＳ１３１３において主要な子孫が更なる処理の
ために選択された場合は、ステップＳ１３１４におい
て、注目されているユニットがフレームフィルタリング
に供される。フレームフィルタリングは、注目されてい
るユニットがフレームであり、そのユニットに外接する
矩形とほぼ同じ幅及び／または高さを有する平行な水平
ライン及び平行な垂直ラインが検出されたかどうかを判
断する。特に、接続コンポーネントは、画素単位の各行
に対して、ユニット内の接続コンポーネントの内側部分
にまたがる最長の距離を計測するために検査される。例
えば、図１５Ａに示されるように、非テキストユニット
４２は接続コンポーネント４３を含む。ここでその接続
コンポーネントの輪郭は、４４で示されるような８方向
追跡によって追跡されたものである。行「ｉ」に対し
て、接続コンポーネントの内部をつなぐ最長の距離は距
離Ｘ_iであり、これは輪郭の最も左の境界４５ａから最
も右の境界４５ｂまでの距離である。一方、行「ｊ」に
関しては、接続コンポーネントの内部をつなぐ２つの距
離が存在する。接続コンポーネントの境界上のポイント
４６ａと４６ｂの間の距離と、ポイント４７ａ及び４７
ｂの間の距離である。ここでは、ポイント４６ａと４６
ｂの間の距離が、ポイント４７ａと４７ｂの間の距離よ
りも長いので、距離Ｘ_jが行「ｊ」に対する接続コンポ
ーネントの内部をつなぐ最長の距離となる。

【００４９】非テキストユニット４２におけるｎ個の行
の各々に対して、“ｘ”なる距離が派生し、以下の不等
式が、その非テキストユニットがフレームかどうかを判
断するために試される。

【００５０】

【数１】

【００５１】ここで、Ｘ_kは、ｋ番目の行（上述したよ
うに）における接続コンポーネントの内部をつなぐ最長
距離であり、Ｗは矩形ユニット４２の幅であり、Ｎは行
の数である。また、閾値thresholdは、前もって計算さ
れたものであり、イメージデータにおいてフレームが傾
斜したりゆがんだりしていても、フレームの検出を可能
とするような値となっている。１度の斜行或いは傾斜角
度を許容するために、ｓｉｎ（１度）×Ｌ＋オフセット
（オフセットはステップＳ１３０４で計算された平均の
テキスト高さに等しい）で求められた閾値が満足の行く
結果をもたらすことが見出されている。

【００５２】上記の不等式が満足された場合、そのユニ
ットはフレームデータに決定され、フローはステップＳ
１３１５を経てステップＳ１３１６へ進む。ステップＳ
１３１６において、「フレーム」属性がそのユニットに
付与される。なお、この点において、複数の属性が各ユ
ニットに付与されうる。こうして、たとえば、フレーム
が「フレームテーブル」或いは「フレームハーフトー
ン」等として指示されることが可能となる。

【００５３】ステップＳ１３１６の後、フローは、フレ
ームデータが表或いはテーブル形式で形成されたデータ
を含む可能性を考慮するために進む。こうして、ステッ
プＳ１３１７において、接続コンポーネントの内部は白
輪郭を取得するために調査される。

【００５４】白輪郭は、上述のステップＳ１３０１にお
いて検出される輪郭に類似するが、ここでは黒画素では
なく白画素が調査される。こうして、図１６Ａに示され
るように、非テキストユニットの内部は、否テキストユ
ニットの内部の右手底部位置から、非テキストユニット
の内部の左手上部分への矢印Ｂの方向に走査される。第
１の白画素に遭遇した場合、白画素に隣接する画素が、
星型状の方向パターン５１に示される順番で調査され
る。なお、星型状パターン５１は、１から４に番号付け
されたベクトルを含む。従って、このステップにおける
白輪郭追跡は、以降、「４−方向」白輪郭追跡と称す
る。白輪郭追跡は、黒画素によって囲まれた全ての白輪
郭が追跡されるまで４方向にて継続される。たとえば、
黒画素セググメント５２，５３，５４及び５５の内部輪
郭を形成する画素を追跡する。また、同様に、白輪郭追
跡は、それらセグメントの内部の、５６で全体が示され
る黒画素のような、他のあらゆる黒画素を追跡する。各
白輪郭が見つけられた後、上述のように、非テキストオ
ブジェクト内に囲まれた全ての白輪郭が追跡されるま
で、走査は矢印Ｂの方向に進む。

【００５５】ステップＳ１３１８において、非テキスト
ユニットの密度が計算される。密度は、接続コンポーネ
ント内の黒画素の数を計数し、黒画素の総数をその矩形
によって囲まれた画素の総数で除することにより計算さ
れる。

【００５６】ステップＳ１３１９において、非テキスト
ユニット内に見出された白輪郭の数が調査される。白輪
郭の数が４以上であった場合、その非テキストイメージ
は、実際は表であるか、或いは一連のテキストブロック
が表の如く整列されたものである可能性がある。従っ
て、ステップＳ１３２０では、白輪郭の充填率が判断さ
れる。白輪郭の充填率は非テキストイメージによって囲
まれた領域を白輪郭が満たす度合いである。図１６Ａに
示されるように、白輪郭充填率は、クロスハッチで示さ
れている領域を含む。ここでクロスハッチで示されてい
る領域は、たとえば、５７，５９のような、完全に空の
白スペースである領域や、その領域中に黒画素が配置さ
れている６０，６１のような白スペースの領域を含む。
充填率が高い場合、その非テキスト領域はテーブル或い
は表として配列されたテキストデータ列である可能性が
ある。従って、ステップＳ１３２１において、充填率が
調査される。充填率が高い場合、その非テキストイメー
ジはテーブルか一連のテキストデータが整列した表であ
る可能性がある。この決定における信頼性を向上するた
めに、白輪郭は、水平及び垂直方向に伸びるグリッド状
の構造を形成するかどうかを判断するために調査され
る。具体的には、ステップＳ１３２２において、非グリ
ッド形態の白輪郭が、それらの境界が水平及び垂直方向
に少なくとも２つの輪郭に到達しない場合は、再結合さ
れる。たとえば、図１６Ａに示されるように、白輪郭５
９の左側境界６２と右側境界６３は、白輪郭６０の左境
界６４と右境界６５に一致するように垂直方向に伸び
る。従って、これら白輪郭がグリッド構造に構成される
ので、これら白輪郭は再結合されない。同様に、白輪郭
６３の上側境界６６と下側境界６７は、白輪郭７０の上
側境界６８と下側境界６９に一致するように水平方向に
延びる。従って、これら白輪郭はグリッド状の構造をも
つので、これら白輪郭は再結合されない。

【００５７】図１６Ｂ〜図１６Ｄは白輪郭が再結合され
る状況を説明する図である。図１６Ｂは、非テキストユ
ニット７１を示す。これは、たとえば、ステップＳ２０
１に関して上述したように、ハーフトーンイメージに閾
値処理を施してバイナリイメージに形成したものであ
る。非テキストイメージ７１は、白領域７４，７５，７
６，７７，７８及び７９と、黒領域７２を含む。これら
白領域の充填率は十分に高いと想定され、ステップＳ１
３２１においてフローを再結合ステップ１３２２に進め
ることになる。まず最初に、図１６Ｃに示されるよう
に、白輪郭７５の上側及び下側境界が、白輪郭７７の上
側及び下側境界と比較される。これらの上側及び下側境
界は一致しないので、図１６Ｃに示されるように、白輪
郭７５は白輪郭７６と結合され、結合された白輪郭７
６’を生成する。

【００５８】図１６Ｄにおいて、白輪郭７７の左右の境
界は、白輪郭７８の左右の境界と比較される。これらの
境界は同じではないので、白輪郭７７と７９は再結合さ
れて一つの白輪郭７７’となる。

【００５９】処理は水平及び垂直方向に、それ以上の再
結合が生じなくなるまで繰り返される。

【００６０】こうして、上述したように、たとえばハー
フトーンイメージ或いは線画のような非テキストに対す
る白輪郭がより再結合しやすいのに対して、表に対する
白輪郭は再結合されにくい。従って、ステップＳ１３２
３において、再結合率が調査される。この再結合率が高
い場合、或いは再結合後に残る白輪郭の数が４未満であ
る場合、フローはステップＳ１３２８に進み、更に詳細
に後述するように、当該非テキストユニットがハーフト
ーンイメージ或いは線画として指定されることになる。

【００６１】ステップＳ１３２３において、再結合率が
高く、少なくとも４つの白輪郭が残った場合、フローは
ステップＳ１３２４へ進み、非テキストイメージが
“表”として指定される。ステップＳ１３２５におい
て、新たに指定された表の内部が調査され、接続コンポ
ーネントを８方向で検出し、分類する。ステップＳ１３
２６において、新しい、内部の接続コンポーネントに従
って、階層構造が更新される。ステップＳ１３２７にお
いて、内部の接続コンポーネントがテキスト或いは非テ
キストに再分類され、ステップＳ１３０２からステップ
Ｓ１３０４に関連して上述したようにして、適切な属性
が付与される。その後、フローはステップＳ１３０７に
戻り、次のユニットが選択される。

【００６２】ステップＳ１３２１とＳ１３２３に戻り、
ステップＳ１３２１において充填率が高くない場合、或
いはステップＳ１３２３において再結合率が高い場合
は、非テキストのフレーム化されたユニットは、ハーフ
トーンイメージか線画のいずれかである可能性が高い。
ユニットがハーフトーンイメージとして分類されるか線
画として分類されるかは、当該ユニット内の黒画素の水
平方向の平均ランレングス、当該ユニット内の白画素の
水平方向の平均ランレングス、黒画素と白画素の比率、
密度に基づいて決定される。概して、非常に暗い画像は
ハーフトーンイメージとみなされ、白い明るいイメージ
は線画とみなされる。

【００６３】特に、白画素の平均ランレングスがほぼゼ
ロに等しい（すなわち、暗い部分或いは斑点が支配的な
画像）場合、そして、ステップＳ１３１８で計算された
密度がそのユニットが白よりもより黒の傾向であること
を示す場合（すなわち、約１／２と等しい第１の閾値よ
りも大きい場合）、フレーム化されたユニットはハーフ
トーンであると決定される。また、密度が第１の閾値よ
りも大きくない場合、そのユニットは線画と判定され
る。

【００６４】白画素の平均ランレングスが、おおよそゼ
ロとはならず、白画素の平均ランレングスが黒画素の平
均ランレングスよりも大きい場合、そのフレーム化され
たユニットは線画であると判断される。しかし、白画素
の平均ランレングスが黒画素の平均ランレングスよりも
大きくない場合（すなわち、周期的な暗い画像）には、
更なるテストが必要となる。

【００６５】具体的には、黒画素の数が白画素の数より
も非常に少ない（すなわち、白画素の数で割られる黒画
素の数が、およそ２である第２の閾値よりも大きい）場
合、そのフレーム化されたユニットはハーフトーンユニ
ットであると判断される。一方、黒画素の数を白画素の
数で割った値が第２の閾値よりも大きくないが、ステッ
プＳ１３１８で決定された密度が第１の閾値よりも大き
い場合、そのフレーム化されたユニットはハーフトーン
イメージであると判断される。そうでない場合には、フ
レーム化されたユニットは線画であると判断される。

【００６６】従って、ステップＳ１３２８において、フ
レーム化されたユニットが線画であると判断されると、
フローはステップＳ１３２９へ進む。ステップＳ１３２
９では、「線画」の属性が付与され、そこからステップ
Ｓ１３３０へ進み、全ての子孫（派生）が取り除かれ
る。詳細にいえば、ユニットが線画であると判断される
と、その線画のユニットから選択される、文字認識が可
能なブロックはない。その後、フローはステップＳ１３
０７へ戻り、次のユニットが選択される。

【００６７】一方、ステップＳ１３２８において、フレ
ーム化されたユニットが線画ではないと判断された場
合、フローはステップＳ１３３１に進む。ステップＳ１
３３１では、「ハーフトーン」の属性が付与され、そこ
からステップＳ１３３２へ進み、そのフレーム化された
ハーフトーンユニットのテキストサイズの子孫が除去さ
れる。テキストサイズはステップＳ１３０４において上
述したように、平均のユニット高さに従って決定され
る。テキストサイズの子孫よりも大きな全ての子孫は、
そのフレーム化されたハーフトーンユニットからの子孫
として残ることが許される。フローはステップＳ１３０
７に戻り、次のブロックが選択される。

【００６８】ステップＳ１３１９に戻って、白領域の数
が４よりも大きくない場合、そのフレーム化されたユニ
ットは表とはみなされない。従って、フローはステップ
Ｓ１３３３へ進み、ステップＳ１３１８で計算された密
度が、およそ０．５に等しい閾値と比較される。閾値
は、フレーム内のテキストユニット或いは線画は、画素
の半分未満しか占有しないという予測に基づいて選択さ
れる。密度が閾値よりも小さい場合、フローはステップ
Ｓ１３３４へ進む。ステップＳ１３３４において、フレ
ーム化されたユニットの内部構造が、上述したように構
成される。すなわち、フローは、フレーム化されたユニ
ットの内部構造のためにステップＳ１３０１に戻る。

【００６９】ステップＳ１３３３において、密度が所定
の閾値よりも小さい場合、そのフレーム化されたユニッ
トが線画とハーフトーンイメージのいずれに分類され得
るか、或いはフレームが分類不能である（すなわち、そ
のフレームは「未知」となる）かについての判断をする
ために、フローはステップＳ１３４３に進む。

【００７０】ステップＳ１３１５に戻り、ステップＳ１
３１４におけるフレームフィルタリングが、非テキスト
ユニット内のフレームを検出しない場合、フローはステ
ップＳ１３３５へ進み、その非テキストユニットがライ
ンを含んでいるかどうかを判断する。ラインは、テキス
ト境界を図示するのに有用な非テキストユニットであ
る。しかし、そのようなラインによって仕切られるテキ
ストは、しばしばそのラインの近傍に現れるので、その
テキストがラインに付着してしまう可能性がある。従っ
て、ライン検出は、テキストの付属を有するラインと有
しないラインの両方を検出するように設計される。

【００７１】付属物のないラインを検出するために、非
テキストユニットのヒストグラムが、そのユニットの縦
の方向において計算される。図１５Ｂに示されるよう
に、ラインのヒストグラム４８は、ある程度均一な分布
を示し、その高さはそのラインの幅とほぼ等しい。ま
た、ラインの幅は非テキストユニットの幅（Ｗ）とほぼ
等しくなる。ここで生じるあらゆる違いは、傾斜角度θ
_αによるものである。それは、画素イメージが形成され
るときに原稿が斜行している場合に、結果として生じる
ものである。従って、その非テキストユニットがライン
を含むかどうかを判断するために、ヒストグラムにおけ
る各セルcell_kの高さ４９が非テキストユニットの幅Ｗ
と比較される。以下のように、これらの値の二乗平均差
が閾値と比較される。

【００７２】

【数２】

【００７３】閾値は、非テキストユニット内のラインの
斜行或いは傾斜θ_αを許容するために計算されたもので
ある。１度の斜行或いは傾斜に対して、閾値を以下の式
で求めることで、満足の行く結果が得られることが見出
されている。

【００７４】

【数３】

【００７５】付属物のないラインが上記の不等式によっ
て見つからなかった場合は、そのユニットが付属物を有
するラインを含むかどうかについての決定がなされる。
付属物を有するラインが非テキストユニットに含まれる
かどうかを判断するために、ラインがテキストユニット
の境界に沿って長手方向に延びているかどうかについて
そのテキストユニットが調べられる。具体的には、その
ユニットをとおして長手方向にラインが延びる場合は、
図１５Ｃに示されるように、そのユニットに外接する矩
形の境界はラインに非常に近接して存在する。従って、
その矩形の境界内に存在する黒画素の均一さが、その境
界からの距離の二乗の和を計算することで調べられる。
こうして、図１５Ｃを参照すると、以下の不等式が試さ
れる。

【００７６】

【数４】

【００７７】もしも二乗の和が所定の閾値よりも小さい
場合は、付属物のついたラインが見いだされる。上記の
付属物のないラインに関して与えられたのと同じ閾値
が、満足の行く結果をもたらすことが見出されている。

【００７８】ステップＳ１３３５において、ラインが検
出されると、フローはステップＳ１３３６を経てステッ
プＳ１３３７へ進む。ステップＳ１３３７において、
「ライン」の属性がその非テキストユニットに付与され
る。そして、フローは、ステップＳ１３３７へ進み、次
のユニットが選択される。

【００７９】一方、ステップＳ１３３５においてライン
が検出されなかった場合、フローはステップＳ１３３６
を経てステップＳ１３３８へ進む。ステップＳ１３３８
では、その非テキストユニットのサイズが検査される。
そのサイズが所定の閾値よりも大きくない場合、その非
テキストユニットの分類は決定されない。なお、この閾
値は、最大のフォントサイズに依存して設定され、最大
フォントサイズの半分を用いると満足の行く結果が得ら
れる。従って、フローはステップＳ１３３９に進み、
「未知」の属性がその非テキストユニットに付与され
る。その後、フローはステップＳ１３０７に戻り、次の
ユニットが選択される。

【００８０】ステップＳ１３３８において、サイズが所
定の閾値よりも大きい場合、フローはステップＳ１３４
０，Ｓ１３４１及びＳ１３４２に進む。ステップＳ１３
４０では、その非テキストユニットの内部白輪郭が追跡
され、ステップＳ１３４１では、その非テキストユニッ
トの密度が計算され、そしてステップＳ１３４２では、
ステップＳ１３１７，Ｓ１３１８及びＳ１３１９に関し
て上述したように、白輪郭の数が調査される。

【００８１】ステップＳ１３４２において、白輪郭の数
が４未満の場合、フローはステップＳ１３４３に進む。
ステップＳ１３４３では、そのユニットのサイズが計算
され、そのユニットが線画或いはハーフトーンイメージ
を構成するのに十分な大きさを有するかどうかを決定す
る。このサイズ決定は、黒画素の最大ランレングスとと
もに、その非テキストユニットの高さ及び幅に基づいて
なされる。具体的には、その非テキストユニットの高さ
及び幅が最大フォントサイズよりも大きくない場合、そ
の非テキストユニットは、ハーフトーンイメージ或いは
線画と判定するには十分な大きさではない。そして、フ
ローはステップＳ１３４４に進み、「未知」の属性が付
与される。同様に、その非テキストユニットの幅が最大
フォントサイズよりも大きいが、黒画素の最大ランレン
グスが最大フォントサイズよりも大きくない場合も、フ
ローはステップＳ１３４４に進み、「不明」の属性が与
えられる。フローはその後、ステップＳ１３０７に戻
り、新しいユニットが選択される。

【００８２】ステップＳ１３４３においてその非テキス
トユニットが線画或いはハーフトーンイメージのいずれ
かであるのに十分な大きさを有する場合、フローはステ
ップＳ１３４５に進み、その非テキストユニットが線画
であるかハーフトーンイメージであるかを決定する。ス
テップＳ１３４５からステップＳ１３４９は、ステップ
Ｓ１３２８からステップＳ１３３２とそれぞれ同様のも
のであり、それらの説明は省略する。

【００８３】図４に戻り、ステップＳ４０４において、
ドキュメントが高解像度でスキャンされる。その結果と
して得られた高解像度画素データが出力イメージを生成
するのに用いられるので、高解像度データであることが
低解像度データよりも望ましい。本発明の他の態様にお
いて、ステップＳ４０１でドキュメントが高解像度でス
キャンされ、ステップＳ４０２において後続のブロック
セレクション処理のために低解像度に変換されるように
してもよい。ステップＳ４０１で高解像度スキャンを行
なうこの他の態様においては、ステップＳ４０４は実行
されないことになる。

【００８４】高解像度画素データがステップＳ４０４で
取得された後、そのデータは、エッジ検出器１１５及び
色度判定ユニット１１６を用いるとともに、検出された
オブジェクト属性やフォントサイズを用いて処理され
る。

【００８５】図３に示されるように、Ｒ４，Ｇ４及びＢ
４の信号は、入力マスキングユニット１０６においてマ
スキング変換されており、黒文字判定ユニット１１３の
エッジ検出器１１５に入力される。図６は、エッジ検出
器の内部構成を示すブロック図である。最初に、輝度信
号Ｙが、輝度計算回路２５０により、Ｒ４，Ｇ４及びＢ
４に基づいて計算される。図７は、回路２５０の詳細な
回路構成を示す図である。

【００８６】図７において、入力されたカラー信号Ｒ，
Ｇ，Ｂのそれぞれには、乗算器３０１，３０２，３０３
によって、係数０．２５，０．５０，０．２５が乗算さ
れる。そして、取得された値は加算器３０４，３０５に
おいて加算される。従って、輝度信号Ｙは、Ｙ＝０．２５Ｒ＋０．５Ｇ＋０．２５Ｂなる等式を用いて計算されることになる。

【００８７】輝度信号Ｙを計算した後、図６のエッジ最
小方向検出器２５１はその信号を３つのラインに展開す
る。図８は、検出器２５１のＦＩＦＯ４０１，４０２を
示す。ＦＩＦＯ４０１，４０２の各々は１ライン分の遅
延をもたらす。これら３つのラインは、周知のラプラシ
アンフィルタ４０３〜４０６によってフィルタされる。
そして、図８に示されるように、検出器２５１は、フィ
ルタから出力されるエッジコンポーネントの量の絶対値
が最小となる方向を決定する。決定された方向はエッジ
方向として指定される。

【００８８】次に、エッジ最小方向スムージングユニッ
ト２５２において、スムージング処理が、輝度信号Ｙに
対して、エッジ最小方向について適用される。スムージ
ング処理を適用することにより、そのエッジコンポーネ
ントを、そのエッジコンポーネントが最大である方向に
維持することが可能となり、そのエッジコンポーネント
を他の方向に平滑化（スムージング）することができ
る。

【００８９】換言すれば、１つの方向のみにエッジコン
ポーネントを有する文字／ラインについては、その特性
が維持される一方で、複数の方向に大きなエッジコンポ
ーネントを有するドットコンポーネントに対して、エッ
ジコンポーネントがエッジ検出器１１５によって平滑化
される。なお、この処理を必要な回数だけ繰り返すこと
により、ラインコンポーネントはドットコンポーネント
からより効果的に分離される。これにより、スクリーン
ドットに含まれる文字コンポーネントを検出することが
可能となる。

【００９０】入力信号は、エッジ検出器２５３において
上述のラプラシアンフィルタによってフィルタされ、エ
ッジ量の絶対値が値ａ以下である信号を排除する。結果
として、エッジ量の絶対値が値ａよりも大きい信号が、
論理「１’ｓ」として出力される。図９Ａ、９Ｂは、エ
ッジ検出の例を示す図である。ここで、図９Ａにおける
輝度データＹのイメージデータは図９Ｂにおいて示され
るエッジ検出信号として出力される。

【００９１】エッジ検出器１１５は、５つのコードのう
ちのいずれかを表す３ビットの「エッジ（edge）」信号
を出力する。そのコードは、エッジが、注目画素の周り
の７×７のブロックサイズのマスク、５×５のブロック
サイズのマスク或いは３×３のブロックサイズのマスク
を用いて注目画素の周りで見出された、マスクなしで注
目画素の周りに見出された、或いはエッジがその注目画
素の周りには見つからなかったことを表す。換言すれ
ば、「エッジ」信号は、合計で５種類の情報を含む３ビ
ットコードであり、その情報はすなわち、エッジ画素と
して検出される画素が、注目画素の周囲の７×７画素ブ
ロック内に存在する、５×５画素ブロック内に存在す
る、３×３画素ブロック内に存在する、注目画素を含む
全てのブロックに存在する、そして注目画素がエッジ画
素と判断されるか否かに関するものである。

【００９２】図１０は、色度決定回路１１６の構成を示
すブロック図である。最大値検出器６０１と最小値検出
器６０２において、最大値であるｍａｘ（Ｒ，Ｇ，Ｂ）
と最小値であるｍｉｎ（Ｒ，Ｇ，Ｂ）がそれぞれ入力さ
れたカラー信号Ｒ４，Ｇ４，Ｂ４から抽出される。そし
て、その差分、ΔＣ＝ｍａｘ（Ｒ，Ｇ，Ｂ）−ｍｉｎ
（Ｒ，Ｇ，Ｂ）が減算器６０３によって計算される。次
に、ＬＵＴ６０４において、図１１に示した特性に従っ
たデータ変換が遂行され、色度信号Ｃｒが生成される。

【００９３】図１１では、色度が低くなる（非色度に近
づく）に従って、ΔＣの値がゼロに近づき、一方、色度
が高くなるに従って、ΔＣの値が増加することが示され
ている。言い換えれば、色の非色度が大きくなるに従っ
てＣｒは大きな値を有し、色度が大きくなるに従ってＣ
ｒはゼロに近づく。なお、図３において色度決定回路１
１６から出力される信号“ｃｏｌ”は、“ｃｏｌｏ
ｒ”、“ｂｌａｃｋ”、“ｇｒａｙ”（“ｃｏｌｏｒ”
と“ｂｌａｃｋ”の中間のカラーを表す）、或いは“ｗ
ｈｉｔｅ”を２ビットコードを用いて表したものであ
る。

【００９４】ＬＵＴ２０５はフォントサイズと属性信号
をブロックセレクションユニット２００から受けとり、
エッジ信号をエッジ検出器１１５から受け取り、ｃｏｌ
信号を色度決定回路１１６から受け取る。ＬＵＴ２０５
は、これらを受けて、ＵＣＲ、ＦＩＬＴＥＲ、ＳＥＮを
出力する。これらが有する値は、本願明細書の発明の背
景の項で説明したとおりである。しかしながら、本発明
によれば、ＵＣＲ、ＦＩＬＴＥＲ、ＳＥＮの信号は、Ｌ
ＵＴ２０５と、上述のフォントサイズ（font size）、
属性（attribute）、エッジ（edge）及びｃｏｌ信号の
内容に基づいたものである。

【００９５】図１２はＬＵＴ２０５の内容を説明する図
である。図示のように、ＬＵＴ２０５は、ｃｏｌ、属性
（attribute）、フォントサイズ（font size））及びエ
ッジ（edge）の各信号に基づいて、対応するＵＣＲ，Ｆ
ＩＬＴＥＲ及びＳＥＮの値を割り当てる。こうして、ブ
ロックセレクションユニット２００から出力された信号
により、ＬＵＴ２０５の内容は、注目画素データにより
適切な処理を提供するために特定され得る。たとえば、
図１の文字太さ判定回路１１４では、注目画素が存在す
る領域のタイプを表わすことを意図する出力信号を生成
する。本実施形態では、ブロックセレクションユニット
２００を用いて、その領域内のテキストサイズと共に、
領域のより正確な判定が得られる。従って、より正確な
処理がその領域について遂行され得る。

【００９６】ＬＵＴ２０５の値を用いた処理の１つの例
は、テキスト画素及びエッジ画素であると判定された注
目画素に対してシャープ化処理（ＦＩＬＴＥＲ＝１）を
実行すること、注目画素がテキスト画素であるともエッ
ジ画素であるとも判定されなかった場合にその注目画素
に平滑化（スムージング)処理（ＦＩＬＴＥＲ＝３）を
実行することである。加えて、テキスト画素であってエ
ッジ画素ではないと判定された画素に対して、その画素
はテキスト文字の内部の領域の一部であると仮定され、
従って、その画素に対して内部平滑化処理（ＦＩＬＴＥ
Ｒ＝０）が実行される。他の例において、非テキスト領
域内の画素に対しては、全体的に平滑化処理（ＦＩＬＴ
ＥＲ＝３）が実行される。もちろん、平滑化処理の他の
組み合わせ、下色除去及び選択された印刷解像度が、本
発明に従って、採用され得る。それらの多くは、図１２
において示される値によって図解されている。

【００９７】以上、本発明について、現在のところその
望ましい実施形態と考えられるものについて説明した
が、本発明が上述したものに限定されないことはいうま
でもない。反対に、本発明は、添付のクレームの精神と
範囲の中に含まれる種々の改良や等価な構成をカバーす
るべく意図するものである。

【図面の簡単な説明】

【図１】一般的な画像処理ユニット内における画像信号
の流れを示すブロック図である。

【図２】本発明の実施形態に係るカラー複写機の断面図
である。

【図３】本発明に係る画像信号のフローを示すブロック
図である。

【図４】本発明に従って画像データを処理するための処
理ステップを示すフローチャートである。

【図５】本発明に従った処理のための画素データを含む
ドキュメントを示す図である。

【図６】エッジ検出回路の内部構成を説明するブロック
図である。

【図７】輝度計算回路の詳細な構成を示す図である。

【図８】ＦＩＦＯによるライン遅延と、ラプラシアンフ
ィルタを示す図である。

【図９Ａ】エッジ検出の例を示す図である。

【図９Ｂ】エッジ検出の例を示す図である。

【図１０】色度半て回路を示すブロック図である。

【図１１】ルックアップテーブルにおけるデータ変換の
特性を説明する図である。

【図１２Ａ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１２Ｂ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１２Ｃ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１２Ｄ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１２Ｅ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１２Ｆ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１２Ｇ】本発明に係るルックアップテーブルの内容
を説明する図である。

【図１３Ａ】画素画像データ中の接続コンポーネントが
どのようにして分類されるかを説明するフローチャート
である。

【図１３Ｂ】画素画像データ中の接続コンポーネントが
どのようにして分類されるかを説明するフローチャート
である。

【図１３Ｃ】画素画像データ中の接続コンポーネントが
どのようにして分類されるかを説明するフローチャート
である。

【図１４Ａ】輪郭追跡を説明する図である。

【図１４Ｂ】輪郭追跡を説明する図である。

【図１４Ｃ】輪郭追跡を説明する図である。

【図１５Ａ】非テキストユニットに対する分類処理を説
明する図である。

【図１５Ｂ】非テキストユニットに対する分類処理を説
明する図である。

【図１５Ｃ】非テキストユニットに対する分類処理を説
明する図である。

【図１６】白輪郭処理を説明する図である。

Claims

【特許請求の範囲】

【請求項１】イメージデータを入力し、入力したイメージデータ内の画素のタイプを判断するた
めに、該イメージデータに対してブロックセレクション
処理を実行し、前記ブロックセレクション処理に基づいて、注目画素デ
ータがテキスト画素を表すかどうかを判断する第１判断
ステップと、前記注目画素データがエッジ画素を表すかどうかを判断
する第２判断ステップと、前記注目画素がテキスト画素及びエッジ画素を表すと判
断された場合に、該注目画素に第１の処理を実行し、前記注目画素がテキスト画素及びエッジ画素を表すと判
断されなかった場合に、該注目画素に第２の処理を実行
することを特徴とする画像処理方法。
【請求項２】前記入力ステップは、第１の解像度のイメージデータを入力する予備走査ステ
ップと、前記第１の解像度よりも高い第２の解像度のイメージデ
ータを入力する走査ステップとを備え、前記ブロックセレクション処理は前記第１の解像度のイ
メージデータについて実行され、前記第２の判断ステップは前記第２の解像度のイメージ
データについて実行されることを特徴とする請求項１に
記載の画像処理方法。
【請求項３】前記入力ステップが、第１の解像度のイメージデータを入力する予備走査ステ
ップと、前記第１の解像度よりも高い第２の解像度のイメージデ
ータを入力する走査ステップとを備え、前記ブロックセレクション処理は前記第１の解像度のイ
メージデータについて実行され、前記第１及び第２の処理は前記第２の解像度のイメージ
データについて実行されることを特徴とする請求項１に
記載の画像処理方法。
【請求項４】前記第１の処理がシャープ化処理であ
り、前記第２の処理がスムージング処理であることを特
徴とする請求項１に記載の画像処理方法。
【請求項５】前記注目画素データがハーフトーン画素
を表しているかどうかを判断する第３の判断ステップ
と、前記注目画素がハーフトーン画素を表すと判断された場
合に、該注目画素データに第３の処理を実行するステッ
プとを更に備えることを特徴とする請求項１に記載の画
像処理方法。
【請求項６】前記ブロックセレクションを実行するス
テップは、前記入力されたイメージデータ内のテキスト
文字のサイズを判断するステップを備えることを特徴と
する請求項１に記載の画像処理方法。
【請求項７】前記画素データのタイプは、ハーフトー
ンのテキスト、ラインアート、ライン、タイトル、テー
ブル、ハーフトーン、フレーム及び背景を含むことを特
徴とする請求項１に記載の画像処理方法。
【請求項８】プロセッサ可読媒体に格納されたプロセ
ッサによる実行が可能な処理ステップであって、イメージデータを入力する入力ステップと、入力したイメージデータ内の画素のタイプを判断するた
めに、該イメージデータに対してブロックセレクション
処理を実行する実行ステップと、前記ブロックセレクション処理に基づいて、注目画素デ
ータがテキスト画素を表すかどうかを判断する第１判断
ステップと、前記注目画素データがエッジ画素を表すかどうかを判断
する第２判断ステップと、前記注目画素がテキスト画素及びエッジ画素を表すと判
断された場合に、該注目画素に第１の処理を実行する処
理ステップと、前記注目画素がテキスト画素及びエッジ画素を表すと判
断されなかった場合に、該注目画素に第２の処理を実行
する処理ステップとを備えることを特徴とするプロセッ
サによる実行が可能な処理ステップ。
【請求項９】前記入力ステップは、第１の解像度のイメージデータを入力する予備走査ステ
ップと、前記第１の解像度よりも高い第２の解像度のイメージデ
ータを入力する走査ステップとを備え、前記ブロックセレクション処理は前記第１の解像度のイ
メージデータについて実行され、前記第２の判断ステップは前記第２の解像度のイメージ
データについて実行されることを特徴とする請求項８に
記載のプロセッサによる実行が可能な処理ステップ。
【請求項１０】前記入力ステップが、第１の解像度のイメージデータを入力する予備走査ステ
ップと、前記第１の解像度よりも高い第２の解像度のイメージデ
ータを入力する走査ステップとを備え、前記ブロックセレクション処理は前記第１の解像度のイ
メージデータについて実行され、前記第１及び第２の処理は前記第２の解像度のイメージ
データについて実行されることを特徴とする請求項８に
記載のプロセッサによる実行が可能な処理ステップ。
【請求項１１】前記第１の処理がシャープ化処理であ
り、前記第２の処理がスムージング処理であることを特
徴とする請求項８に記載のプロセッサによる実行が可能
な処理ステップ。
【請求項１２】前記注目画素データがハーフトーン画
素を表しているかどうかを判断する第３の判断ステップ
と、前記注目画素がハーフトーン画素を表すと判断された場
合に、該注目画素データに第３の処理を実行する処理ス
テップとを更に備えることを特徴とする請求項８に記載
のプロセッサによる実行が可能な処理ステップ。
【請求項１３】前記ブロックセレクションを実行する
ステップは、前記入力されたイメージデータ内のテキス
ト文字のサイズを判断するステップを備えることを特徴
とする請求項８に記載のプロセッサによる実行が可能な
処理ステップ。
【請求項１４】前記画素データのタイプは、ハーフト
ーンのテキスト、ラインアート、ライン、タイトル、テ
ーブル、ハーフトーン、フレーム及び背景を含むことを
特徴とする請求項８に記載のプロセッサによる実行が可
能な処理ステップ。
【請求項１５】イメージデータを入力する手段と、前記入力したイメージデータ内の画素のタイプを判断す
るために、該イメージデータに対してブロックセレクシ
ョン処理を実行する手段と、前記ブロックセレクション処理に基づいて、注目画素デ
ータがテキスト画素を表すかどうかを判断する第１判断
手段と、前記注目画素データがエッジ画素を表すかどうかを判断
する第２判断手段と、前記注目画素がテキスト画素及びエッジ画素を表すと判
断された場合に、該注目画素に第１の処理を実行する手
段と、前記注目画素がテキスト画素及びエッジ画素を表すと判
断されなかった場合に、該注目画素に第２の処理を実行
する手段とを備えることを特徴とする画像処理装置。
【請求項１６】前記入力する手段は、第１の解像度の
イメージデータを入力する手段と、前記第１の解像度よりも高い第２の解像度のイメージデ
ータを入力する手段とを備え、前記ブロックセレクション処理は前記第１の解像度のイ
メージデータについて実行され、前記第２の判断手段は前記第２の解像度のイメージデー
タについて動作することを特徴とする請求項１５に記載
の画像処理装置。
【請求項１７】前記入力する手段が、第１の解像度のイメージデータを入力する手段と、前記第１の解像度よりも高い第２の解像度のイメージデ
ータを入力する手段とを備え、前記ブロックセレクション処理は前記第１の解像度のイ
メージデータについて実行され、前記第１及び第２の処理は前記第２の解像度のイメージ
データについて実行されることを特徴とする請求項１５
に記載の画像処理装置。
【請求項１８】前記第１の処理がシャープ化処理であ
り、前記第２の処理がスムージング処理であることを特
徴とする請求項１５に記載の画像処理装置。
【請求項１９】前記注目画素データがハーフトーン画
素を表しているかどうかを判断する第３判断手段と、前記注目画素がハーフトーン画素を表すと判断された場
合に、該注目画素データに第３の処理を実行する手段と
を更に備えることを特徴とする請求項１５に記載の画像
処理装置。
【請求項２０】前記ブロックセレクションを実行する
手段は、前記入力されたイメージデータ内のテキスト文
字のサイズを判断することを特徴とする請求項１５に記
載の画像処理装置。
【請求項２１】前記画素データのタイプは、ハーフト
ーンのテキスト、ラインアート、ライン、タイトル、テ
ーブル、ハーフトーン、フレーム及び背景を含むことを
特徴とする請求項１５に記載の画像処理装置。