JP2001274990A - 画像処理方法及び装置 - Google Patents
画像処理方法及び装置Info
- Publication number
- JP2001274990A JP2001274990A JP2000376263A JP2000376263A JP2001274990A JP 2001274990 A JP2001274990 A JP 2001274990A JP 2000376263 A JP2000376263 A JP 2000376263A JP 2000376263 A JP2000376263 A JP 2000376263A JP 2001274990 A JP2001274990 A JP 2001274990A
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- image data
- resolution
- processing
- text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000003672 processing method Methods 0.000 title claims 7
- 238000012545 processing Methods 0.000 claims abstract description 100
- 238000000034 method Methods 0.000 claims description 62
- 238000009499 grossing Methods 0.000 claims description 13
- 238000010586 diagram Methods 0.000 description 32
- 238000001914 filtration Methods 0.000 description 8
- 238000005215 recombination Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 238000001514 detection method Methods 0.000 description 5
- 238000003708 edge detection Methods 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 230000000873 masking effect Effects 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 2
- 238000003705 background correction Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 230000003111 delayed effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000284156 Clerodendrum quadriloculare Species 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000004042 decolorization Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20004—Adaptive image processing
- G06T2207/20012—Locally adaptive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Analysis (AREA)
- Image Input (AREA)
Abstract
処理システムを提供する。 【解決手段】画像処理システムは、イメージデータの入
力と、入力したイメージデータ内の画素のタイプを判断
するための、該イメージデータに対するブロックセレク
ション処理の実行と、前記ブロックセレクション処理に
基づいて注目画素データがテキスト画素を表すかどうか
を判断する第1判断ステップと、この注目画素データが
エッジ画素を表すかどうかを判断する第2判断ステップ
と、注目画素がテキスト画素及びエッジ画素を表すと判
断された場合の、該注目画素に対する第1の処理の実行
と、前記注目画素がテキスト画素及びエッジ画素を表す
と判断されなかった場合の、該注目画素に対する第2の
処理の実行を含む。
Description
に関する。更に詳しくは、本発明は、入力された画素デ
ータの検出された特徴に基づいて画素データが処理され
る画像処理システムに関する。
る、米国特許第5,680,479号(名称は「文字認識方法及
び装置」、米国特許出願番号07/873,012)と、米国特許
第5,588,072号(名称は「格納されたドキュメントにお
けるテキスト及び・又は非テキストブロックを選択する
ための方法及び装置、米国特許出願番号08/171,720)
と、米国特許出願第08/338,781(名称は「ページ解析シ
ステム」)と、米国特許第5,774,579号(名称は「オー
バラップするブロックが分解されるブロックセレクショ
ンシステム」、米国特許出願番号08/514,250)と、米国
特許第5,848,186号(名称は「特徴抽出システム」、米
国特許出願番号08/514,252)と、米国特許出願番号08/6
64,674(名称は「付属されたテキストを抽出するシステ
ム」)と、米国特許出願番号08/751,677(名称は「ペー
ジ解析システム」)と、米国特許第5,825,944号(名称
は「ブロックセレクションのレビュー及び編集システ
ム、米国特許出願番号08/834,856)と、米国特許出願番
号09/002,684(名称は「テーブルイメージの解析システ
ム」)と、米国特許出願番号09/161,716(名称は「カラ
ーブロックセレクション」)と、米国特許出願番号09/2
22,860(名称は「テーブル特徴のブロックセレクショ
ン」)とは、その全てが記載されているものとして本願
に組み込まれる。
処理システムは、原稿文書を走査することによって画素
データを取得し、レーザビーム方式の再生エンジンや、
インクジェット方式の再生システム等への受け渡しに適
した出力データを生成するために、そのデータに対して
種々の画像処理ステップを実行する。特に、一般的な画
像処理システムでは、たとえば「画像処理装置及び方
法」という名称の米国特許第(CFM595US)に記載されて
いるように、まず、電化結合素子(CCD)から走査さ
れた画像を表す赤(R)、緑(G)及び青(B)の信号
が受信される。受信された信号は、次いで、画像処理に
提供される。
ある。図1に示されるように、CCDから出力された画
像信号はアナログ信号処理ユニット101に入力され
る。ここで、その信号は、ゲイン及びオフセットが調整
される。次に、R,G及びBの各信号は、A/D変換器
102によって、それぞれ8ビットのデジタル画像信号
R1,G1及びB1に変換される。そして、これらの信
号は、シェーディング補正回路103に入力され、各信
号に対してシェーディング補正が適用される。ライン遅
延回路104及び105はCCD内のセンサを空間的に
補償するのに用いられる。この補償により、R1,G1
及びB1の各信号間のタイミングを整合させ、ライン遅
延回路105以降では、同時刻におけるR,G及びBの
信号が同一画素を表すようになる。
の色分解特性によって決定される読み取り色空間を、標
準の色空間に変換する。ログ変換器107は輝度信号R
4,G4及びB4を濃度信号C0,M0及びY0に変換
する。そして、UCR(下色除去)、FILTER及び
SENの各信号が生成されて決定されるまでの間、濃度
信号はライン遅延メモリ108によって遅延される。
の後に、マスキングUCR回路109はUCR信号を用
いて上記濃度信号から黒信号を抽出する。可変変倍回路
110は主走査方向に、画像信号及び黒文字判定信号を
拡大、縮小する。空間フィルタ処理ユニット111は、
FILTER信号を用いてフィルタリングを実行し、そ
の結果として得られるフレーム順の画像信号M4,C
4,Y4及びBk4が、SEN信号とともに再生エンジ
ン112に送られる。ここで、SENは、画像出力され
る際の解像度を決定する。
R、FILTER及びSEN信号は、黒文字検出ユニッ
ト115より出力される。特に、黒信号検出ユニット1
13によって生成されたUCR信号は、黒から薄くなる
順に0〜7の値を有し、マスキングUCR回路109が
黒信号Bk2を生成するために、信号Y1,M1及びC
1から除去するべき黒成分の量を示す。黒文字判定回路
113によって生成されたFILTER信号は、スムー
ジング、強エッジ強調、中エッジ強調、弱エッジ強調の
それぞれを表す値0,1,2及び3を示す2ビット値で
ある。したがって、FILTER信号は、信号Y3,M
3,C3及びBk3に適用されるフィルタリングの度合
い及びタイプを制御するために、空間フィルタ処理ユニ
ット111に入力される。
生エンジン112に出力される。このSEN信号におい
て、値0は200ライン/インチでプリントを処理する
ことを示し、値1は、400ライン/インチのプリント
処理を要求することを示す。
ックアップテーブル(LUT)117の出力である。L
UT117は、注目画素を含む文字の幅、注目画素の文
字のエッジへの近接度、注目画素の色度を表す信号を受
信する。したがって、UCR,FILTER及びSEN
の各出力値は各注目画素について計算され、LUTによ
って特定される関係に従って、その画素に対応して検出
された文字幅、エッジ近接度及び色度に基づいて決定さ
れる。
ジの近くに配置され、低い色度を有し、比較的細い文字
に含まれるような注目画素について用いられる。そのよ
うなファクタは、その画素が小さな、黒文字内にあるこ
とを示すからである。他の例において、その注目画素が
エッジの近くではなく、非常に濃い領域に含まれている
場合、SEN信号に値0(200ライン/インチの解像
度に対応)が割り当てられる。大きなドットよりも単位
ユニット領域あたりにより多くのトナーを提供する、よ
り大きなトナードットが、より良好なハーフトーンイメ
ージを生成するからである。
FM595US)に記載されているような、一般的な画
像処理システムは、画素に対する適切な処理パラメータ
を決定するために、いくつかのファクターに基づいて注
目画素の性質を「推測」する。そのようなアプローチの
ひとつの短所は、推測された性質が間違っていた場合、
その画素に不適切な処理が実行されてしまうことであ
る。
データの正確で安価に、検出された属性を使用してイメ
ージ処理を改良する画像処理システムである。
れるべき処理を決定するためにブロックセレクション処
理の結果を利用することによって、上述の問題に対処す
るものである。このように、ブロックセレクション処理
の結果を用いることで、上述した一般的なシステムを用
いる場合よりも注目画素の性質をより具体的に特定する
ことができる。従って、より適切な処理が画素データに
適用され得る。加えて、既存のイメージ処理ハードウェ
アと組み合わせて、そのようなブロックセレクション処
理を用いることにより、イメージ処理は高速に進む。そ
の上、ブロックセレクション処理は、好ましくはソフト
ウエアベースであり、それゆえ、安価に実行できる。
し、入力したイメージデータ内の画素のタイプを判断す
るために、当該イメージデータに対してブロックセレク
ション処理が実行され、前記ブロックセレクション処理
に基づいて、注目画素データがテキスト画素を表すかど
うかが判断され、更にその注目画素データがエッジ画素
を表すかどうかが判断される、画像処理システムを指向
するものである。そして、その注目画素がテキスト画素
及びエッジ画素を表すと判断された場合に、該注目画素
に第1の処理が実行され、その注目画素がテキスト画素
及びエッジ画素を表すと判断されなかった場合には、該
注目画素に第2の処理が実行される。
理が画像データに対して適用される。たとえば、上記第
1の処理は好ましくはシャープ化処理であり、前記第2
の処理が好ましくはスムージング処理である。
テップは、第1の解像度でイメージデータ予備走査し、
上記第1の解像度よりも高い第2の解像度でイメージデ
ータを走査する。そして、上記ブロックセレクション処
理は上記第1の解像度におけるイメージデータについて
実行され、シャープ化処理とスムージング処理は第2の
解像度におけるイメージデータについて実行される。こ
の更なる態様は、全体の処理が迅速に完了することを可
能とする。
ハーフトーンのテキスト、ラインアート、ライン、タイ
トル、テーブル、ハーフトーン、フレーム及び背景であ
ることを判断することを考慮する。従って、適切な画像
処理がこれら画素データタイプに基づいて適用され得
る。
るように提供されたものである。本発明のより完全な理
解は、いかに添付図面に関連してなされた本実施形態の
詳細な説明を参照することによりなされ得る。
よる画像処理装置の断面を示す図である。図2の装置に
おいて、イメージスキャナ201は原稿文書を読み取
り、読み取った原稿の画素データにデジタル処理を施し
てディジタル信号とする。プリンタ218は、イメージ
スキャナ201によって読み取られた原稿文書に対応す
るイメージを、印刷用紙上にフルカラーでプリントす
る。
書204はプラテンガラス上にセットされ、原稿カバー
202でもってカバーされ、ハロゲンランプ205によ
って露光される。原稿文書204からの反射光は、更に
ミラー206及び207によって反射され、レンズ20
8を通過した後に、R,G及びB信号を特定するための
CCD210にフォーカスする。なお、レンズ208は
赤外線フィルタ231によってカバーされている。
成分を読み取るためのCCD210における各センサの
行は、5000画素からなる。こうして、CCD210
は、A3サイズの短辺長、すなわち297mmの長さに
渡って、400dpiの解像度で読み取ることができ
る。CCD210は原稿文書のカラー情報を、R,G及
びBの色成分のフルカラー情報へ分離し、そのフルカラ
ー情報を色信号へ変換する。
R,G,Bフォトセンサ210−1〜210−3による
読み取りデータを校正するための校正データを生成す
る。この標準白板211は、可視光領域において均一な
反射特性を有しており、白色に見える。データを校正し
た後、CCD210は信号を信号処理ユニット209へ
送る。
6は速度vで移動し、ミラー207は速度1/2vで移
動する。これらの移動方向は、CCD210の電気的走
査方向(主走査方向)に対して直角な方向である。原稿
文書204の全領域は、この方法で走査される。
読み取り信号は電気的に処理され、マゼンタ(M)、シ
アン(C)、イエロー(Y)及び黒(Bk)の色成分に
分離され、プリンタ218に送られる。イメージスキャ
ナ201による各走査動作に対して、色成分データM,
C,Y及びBkのうちの一つがプリンタ218に送られ
る。こうして、原稿文書204を4回走査することによ
って、一つのカラー画像が形成される。
ナ201からのM,C,Y及びBkの各色信号は、レー
ザドライバ212に送られる。レーザドライバ212
は、画像信号に基づいて変調された信号によって半導体
レーザ213を駆動する。レーザビームは、ポリゴンミ
ラー214、f−θレンズ215及びミラー216を介
して、静電ドラム217を走査する。
アン現像器220、イエロー現像器221、及び黒現像
器222からなる。これら4つのドラムは、静電ドラム
217と接触し、それによって回転し、静電ドラム21
7上に形成されたM,C,Y及びBkの潜像を対応する
色のトナーで現像する。更に、転写ドラム223は、用
紙カセット224或いは225から供給された記録紙を
吸着して、静電ドラム217上に現像されたトナーイメ
ージをその用紙上に転写させる。そしてその用紙は、定
着ユニット226を通過した後に排出される。
すブロック図である。図3に示される構成で、図1に示
したのと同一の参照番号を有するものは、図1に関して
上述したように動作する。さて、図3では、フォントサ
イズと属性を表す信号を出力するブロックセレクション
ユニット200が示されている。ブロックセレクション
ユニット200は、図3においてハードウエアユニット
として示されているが、ここで説明されるブロックセレ
クション処理と、ここで参照によって組み込まれるアプ
リケーションにおいて説明されるブロックセレクション
処理は、ソフトウエアによって実現されてもよいし、ソ
フトウエアとハードウエアのコンビネーションによって
実現されてもよい。更に、ブロックセレクションユニッ
ト200は黒文字検出ユニット113のエレメントでな
くともよい。
ット200は入力された画像データに対してブロックセ
レクション処理を実行し、そのデータ内のオブジェクト
の属性とともに、そのデータ内のテキストのフォントサ
イズを決定する。更に詳細には、ブロックセレクション
ユニット200は、入力された画像データの各画素に対
してその画素が配置されているオブジェクトの属性を割
り当てるとともに、もしその画素がテキスト内にあるの
ならば当該テキストのフォントサイズを割り当てる。
内容を有するLUT205が示されている。LUT20
5について概要を述べれば、LUT205はフォントサ
イズ(font size)、属性(attribute)、エッジ(edg
e)及びcolを入力信号とし、UCR,FILTER
及びSENを出力信号とするものである。LUT205
の詳細な内容は後述する。
する処理ステップのフローチャートである。フローはス
テップS401から始まり、ここでまず、文書が低解像
度でスキャンされる。好適な実施形態においては、図2
に関して上述したように、そのようなスキャニングがイ
メージスキャナ201によって実行されることになる。
もちろん、ステップS401において、文書をスキャン
するための他のシステムを用いることも可能である。一
般的に低解像度のスキャンは高解像度のスキャンよりも
より高速に動作するので、ステップS401において
は、処理時間を減らすために文書が低解像度でスキャン
される。加えて、出願人は、低解像度画素データは、こ
れに続くブロックセレクション処理に供された場合に満
足の行く結果をもたらすことを見出している。
ンされ得る文書例を示す図である。文書210は、タイ
トル211、水平のライン212、テイスト領域21
4、画像領域215、線画領域216及び表217を含
んでいる。ブロックセレクション処理は、他の多くのタ
イプとともに、これらの分離されたオブジェクト領域の
各タイプを特定する。
クション処理は、スキャンされた文書内に配置されたオ
ブジェクトの属性及びテキストのフォントサイズを検出
する。一般的なブロックセレクション技術(或いはペー
ジ分割(page segmentation)技術)がステップS40
2に用いられ得る。また、上記においてリストアップ
し、本願に参照として組み込まれている特許出願におい
て記載されているような技術も含まれる。
内のオブジェクトを特定し、その特定されたオブジェク
トに対して、ピクチャ、テキスト、タイトル、表、線画
等のような属性を割り当てる。上記のリストに上げた出
願に記載されているように、他の多くのタイプの属性が
特定されたオブジェクトに割り当てられてもよい。ま
た、オブジェクトの特定において、本発明に従って用い
られるブロックセレクション処理技術は、テキストオブ
ジェクト内の個々のテキスト文字のサイズを検出する。
ション技術の一つの例として、米国特許第5,680,479号
に記載されているものがあげられる。この技術を用い
て、画像内において特定されたオブジェクトは、サイズ
情報とともに、オブジェクトのタイプ(たとえばテキス
ト、ピクチャ、表等)を特定する属性が割り当てられ
る。図13は、この技術に従ったブロックセレクション
を実行する処理ステップのフローチャートである。図1
3の各処理ステップは、ハードウエアで実現されても、
ソフトウエア或いはハードウエアとソフトウエアのコン
ビネーションによって実現されてもよい。
エアによって実現される場合には、読み出し専用メモリ
(ROM)に格納されたコンピュータプログラムに従っ
て中央処理装置(CPU)がこれらを実行することにな
る。読み書き可能なメモリ(RAM)が、入力画像デー
タ、処理画像データ、画像の構造に関する情報等を格納
するのに用いられ得る。CPUは、ROM、RAM及び
入出力デバイス(たとえば、ディスクメモリ、プリンタ
/ディスプレイ、スキャナ等)に、バスを介して接続さ
れている。
ト(以下、接続コンポーネント)を検出し、その接続コ
ンポーネントをそれらのサイズ、及び他の接続コンポー
ネントとの相対的な位置に従って分類するべく、画像が
解析される。接続コンポーネントは、白画素によって完
全に囲まれた黒画素ブロックのグループである。従っ
て、接続コンポーネントとは、少なくとも一つの白画素
によって他の黒画素グループから完全に分離されている
グループである。はじめに、各接続コンポーネントは、
テキストユニットか非テキストユニットに分類される。
接続コンポーネントの組織的データを提供するために、
階層ツリー構造が形成される。
ータ中の接続コンポーネントは、輪郭追跡によって検出
される。輪郭追跡は、図14Aにおいて示されるように
画像データを走査することによって進められる。走査
は、画像の右下部分から左へと矢印Aによって示される
ように進められ、画像の右側境界に遭遇すると、上方へ
と進む。走査は、他の方向に進むようにしてもよい。た
とえば、左上から右下へと進んでもよい。黒画素に遭遇
したとき、隣接する画素について、その黒画素に隣接す
る画素もまた黒であるかどうかが、31に示される星型
状のパターンの順で調べられる。星型バースト状パター
ン31が共通の中心から放射状に伸びる8個のベクトル
を含むので、この輪郭追跡を、以降、「8方向」追跡と
称する。隣接した黒画素が見つかった場合は、画像の外
輪郭が追跡され終わるまで、上述したように処理が続け
られる。こうして、図14Bに示されるように、矢印A
の方向における走査は文字「Q」の尻尾部分に対応する
ポイント32を見つける。文字「Q」の外輪郭が追跡さ
れるように、隣接画素の検査が星型バースト状パターン
31に従って進む。なお、閉じた輪郭の内側部分は追跡
されない。
方向追跡によってその輪郭が追跡された後、走査は次の
黒画素が見つかるまで進められる。同様にして、手書き
の単語「非テキスト(non-text)」である非テキストオ
ブジェクト35が追跡される。その追跡は、単語「テキ
スト(text)」を形成する各文字であるテキストオブジ
ェクト36中の個々の文字と同様である。図14Aに示
される走査は、画素データ中のすべての接続コンポーネ
ントが検出され、8方向追跡によってそれらの輪郭が検
出されるまで続けられる。
続コンポーネントが矩形化される。特に、可能な限り最
小の外接矩形が、各接続コンポーネントの周りに描画さ
れる。こうして、図14Bに示されるように、矩形37
がオブジェクト32の周りに描画され、矩形39はオブ
ジェクト34の周りに描画され、矩形40はオブジェク
ト35の周りに描画され、そして、矩形41a、41
b、41c及び41dがテキストオブジェクト36a、
36b、36c及び36dの周りにそれぞれ描画され
る。
位置が各矩形ユニットに対して割り当てられる。大部分
に関して、ステップS1303で取得されたツリー構造
においては、画素画像における各オブジェクトに関し
て、ツリーのルートから直接に進んでくる。これは、接
続コンポーネントの外輪郭のみが追跡され、閉じた輪郭
の内側部分は追跡されないからである。
コンポーネント32に対応する矩形37はそのページの
ルートから直接に出てくる。しかしながら、非テキスト
オブジェクト35に対応する矩形40、テキストオブジ
ェクト36a及び36bに対応する矩形36a及び36
bのような、その矩形が完全に別の接続コンポーネント
内に存在してしまう接続コンポーネントに関して、それ
らの接続コンポーネントは、それを囲む接続コンポーネ
ント(この場合、コンポーネント34)からの子孫とし
て示されている。加えて、少なくとも一つの子孫を持つ
各接続コンポーネントは、たとえばコンポーネント34
であるが、そのコンポーネント自身は、それ自身からの
「主要な子孫」として示される。
に、コンポーネント39は、コンポーネント39の他の
子孫40、41a及び41bの中の主要な子孫として含
まれる。ステップS1304において、ツリーの第1レ
ベルの接続コンポーネントの各々は、テキストユニット
か或いは非テキストユニットのいずれかに分類される。
この分類は2つのステップを経てなされる。まず第1の
ステップにおいて、接続コンポーネントに対する矩形が
所定のサイズ閾値と比較される。その接続コンポーネン
トを囲む矩形の高さが、予期される最大のフォントサイ
ズに対応する第1の所定の閾値よりも大きい場合、或い
は、その接続された輪郭を囲む矩形の幅が、ページを経
験的に決定された定数(「5」が満足のいく結果をもた
らすことが見出されている)によって分割して得られる
幅よりも広い場合、その接続コンポーネントは非テキス
トユニットとして分類され、当該ユニットに非テキスト
属性が付与される。
ユニット、すなわち、まだ非テキストとして分類されて
いないユニットが、すべての残りの接続コンポーネント
について集めたサイズに基づいて適応的に決定された閾
値と比較される。具体的には、非テキストユニットとし
て決定されていないすべての矩形の高さが平均される。
この平均高さは、スカラー量(好適には「2」が選択さ
れる)によって乗算され、適応的に決定された閾値が得
られる。そして、この適応的に決定された閾値よりも大
きいすべてのユニットが、非テキストであると推定され
る。従って、他方の、当該適応的に決定された閾値より
も小さいすべてのユニットはテキストであると推定され
る。このようにしてユニットは分類され、適当な属性が
付与される。そして、これらの分類の両方が、図13の
残りの部分において示され、以下においてより完全に説
明されるような精錬処理を受ける。
ットがテキスト或いは非テキストに分類された後、テキ
ストユニットの全ての子孫(主要な子孫を含めて)が、
まずテキストユニットに分類される。また、非テキスト
ユニットにおいてその主要な子孫の分類は非テキストと
して維持されるが、非テキストユニットのすべての他の
子孫はテキストユニットに分類される。
トが選択される。ステップS1306において、そのユ
ニットがテキストユニットであった場合、フローはステ
ップS1307へ進み、次のユニットが選択される。フ
ローにおいて、ステップS1306及びS1307が、
非テキストユニットが選択されるまで続行される。非テ
キストユニットが選択されると処理はステップS130
8へ進む。
ストユニットが検査され、当該ユニットからの子孫があ
るかどうかが判断される。たとえば、図14Cに示され
るように、非テキストユニット39は非テキストの主要
な子孫39と、テキスト子孫40、41a及び41bを
含む。ステップS1308において子孫が存在した場合
は、フローはステップS1309へ進む。ステップS1
309において、ユニットはフィルター処理され、その
ユニットがハーフトーン(或いはグレースケール)であ
るかどうかが判断される。ハーフトーンフィルタリング
において、ユニットの子孫が検査され、「ノイズ」サイ
ズよりも小さいサイズを有する子孫の数が判断される。
「ノイズサイズ」のユニットは、その高さが、画像デー
タとして期待される最小のフォントサイズよりも小さい
ものである。ノイズサイズよりも小さいサイズの子孫の
数が子孫の全数の半分よりも大きい場合は、そのユニッ
トはハーフトーンイメージであると判定される。従っ
て、ステップS1310において、フローはステップS
1311に進み、「ハーフトーン」属性がそのユニット
に付与される。その後、ステップS1312では、その
ハーフトーンイメージ中に組み込まれたあらゆるテキス
トがチェックされる。具体的には、ハーフトーンイメー
ジのテキストサイズの子孫の各々のツリー構造は、その
テキストサイズのユニットがもはやハーフトーンイメー
ジからの子孫ではなく、ハーフトーンイメージと同じレ
ベルであるように、変更される。これは、そのようなも
のが適切であると思われるならば、ハーフトーンイメー
ジにおけるテキストサイズのユニットの文字認識を可能
とする。その後、フローはステップS1307に戻り、
次のユニットが処理のために選択される。
ンフィルタリングが、そのユニットはハーフトーンイメ
ージでないと判断した場合、フローはステップS131
0を経てステップS1313に進む。ステップS131
3において、そのユニットの主要な子孫が更なる処理の
ために選択される。そして、フローはステップS131
4に進む。
ニットが子孫を持っていないと判断された場合、或いは
ステップS1313において主要な子孫が更なる処理の
ために選択された場合は、ステップS1314におい
て、注目されているユニットがフレームフィルタリング
に供される。フレームフィルタリングは、注目されてい
るユニットがフレームであり、そのユニットに外接する
矩形とほぼ同じ幅及び/または高さを有する平行な水平
ライン及び平行な垂直ラインが検出されたかどうかを判
断する。特に、接続コンポーネントは、画素単位の各行
に対して、ユニット内の接続コンポーネントの内側部分
にまたがる最長の距離を計測するために検査される。例
えば、図15Aに示されるように、非テキストユニット
42は接続コンポーネント43を含む。ここでその接続
コンポーネントの輪郭は、44で示されるような8方向
追跡によって追跡されたものである。行「i」に対し
て、接続コンポーネントの内部をつなぐ最長の距離は距
離Xiであり、これは輪郭の最も左の境界45aから最
も右の境界45bまでの距離である。一方、行「j」に
関しては、接続コンポーネントの内部をつなぐ2つの距
離が存在する。接続コンポーネントの境界上のポイント
46aと46bの間の距離と、ポイント47a及び47
bの間の距離である。ここでは、ポイント46aと46
bの間の距離が、ポイント47aと47bの間の距離よ
りも長いので、距離Xjが行「j」に対する接続コンポ
ーネントの内部をつなぐ最長の距離となる。
の各々に対して、“x”なる距離が派生し、以下の不等
式が、その非テキストユニットがフレームかどうかを判
断するために試される。
うに)における接続コンポーネントの内部をつなぐ最長
距離であり、Wは矩形ユニット42の幅であり、Nは行
の数である。また、閾値thresholdは、前もって計算さ
れたものであり、イメージデータにおいてフレームが傾
斜したりゆがんだりしていても、フレームの検出を可能
とするような値となっている。1度の斜行或いは傾斜角
度を許容するために、sin(1度)×L+オフセット
(オフセットはステップS1304で計算された平均の
テキスト高さに等しい)で求められた閾値が満足の行く
結果をもたらすことが見出されている。
ットはフレームデータに決定され、フローはステップS
1315を経てステップS1316へ進む。ステップS
1316において、「フレーム」属性がそのユニットに
付与される。なお、この点において、複数の属性が各ユ
ニットに付与されうる。こうして、たとえば、フレーム
が「フレームテーブル」或いは「フレームハーフトー
ン」等として指示されることが可能となる。
ームデータが表或いはテーブル形式で形成されたデータ
を含む可能性を考慮するために進む。こうして、ステッ
プS1317において、接続コンポーネントの内部は白
輪郭を取得するために調査される。
いて検出される輪郭に類似するが、ここでは黒画素では
なく白画素が調査される。こうして、図16Aに示され
るように、非テキストユニットの内部は、否テキストユ
ニットの内部の右手底部位置から、非テキストユニット
の内部の左手上部分への矢印Bの方向に走査される。第
1の白画素に遭遇した場合、白画素に隣接する画素が、
星型状の方向パターン51に示される順番で調査され
る。なお、星型状パターン51は、1から4に番号付け
されたベクトルを含む。従って、このステップにおける
白輪郭追跡は、以降、「4−方向」白輪郭追跡と称す
る。白輪郭追跡は、黒画素によって囲まれた全ての白輪
郭が追跡されるまで4方向にて継続される。たとえば、
黒画素セググメント52,53,54及び55の内部輪
郭を形成する画素を追跡する。また、同様に、白輪郭追
跡は、それらセグメントの内部の、56で全体が示され
る黒画素のような、他のあらゆる黒画素を追跡する。各
白輪郭が見つけられた後、上述のように、非テキストオ
ブジェクト内に囲まれた全ての白輪郭が追跡されるま
で、走査は矢印Bの方向に進む。
ユニットの密度が計算される。密度は、接続コンポーネ
ント内の黒画素の数を計数し、黒画素の総数をその矩形
によって囲まれた画素の総数で除することにより計算さ
れる。
ユニット内に見出された白輪郭の数が調査される。白輪
郭の数が4以上であった場合、その非テキストイメージ
は、実際は表であるか、或いは一連のテキストブロック
が表の如く整列されたものである可能性がある。従っ
て、ステップS1320では、白輪郭の充填率が判断さ
れる。白輪郭の充填率は非テキストイメージによって囲
まれた領域を白輪郭が満たす度合いである。図16Aに
示されるように、白輪郭充填率は、クロスハッチで示さ
れている領域を含む。ここでクロスハッチで示されてい
る領域は、たとえば、57,59のような、完全に空の
白スペースである領域や、その領域中に黒画素が配置さ
れている60,61のような白スペースの領域を含む。
充填率が高い場合、その非テキスト領域はテーブル或い
は表として配列されたテキストデータ列である可能性が
ある。従って、ステップS1321において、充填率が
調査される。充填率が高い場合、その非テキストイメー
ジはテーブルか一連のテキストデータが整列した表であ
る可能性がある。この決定における信頼性を向上するた
めに、白輪郭は、水平及び垂直方向に伸びるグリッド状
の構造を形成するかどうかを判断するために調査され
る。具体的には、ステップS1322において、非グリ
ッド形態の白輪郭が、それらの境界が水平及び垂直方向
に少なくとも2つの輪郭に到達しない場合は、再結合さ
れる。たとえば、図16Aに示されるように、白輪郭5
9の左側境界62と右側境界63は、白輪郭60の左境
界64と右境界65に一致するように垂直方向に伸び
る。従って、これら白輪郭がグリッド構造に構成される
ので、これら白輪郭は再結合されない。同様に、白輪郭
63の上側境界66と下側境界67は、白輪郭70の上
側境界68と下側境界69に一致するように水平方向に
延びる。従って、これら白輪郭はグリッド状の構造をも
つので、これら白輪郭は再結合されない。
る状況を説明する図である。図16Bは、非テキストユ
ニット71を示す。これは、たとえば、ステップS20
1に関して上述したように、ハーフトーンイメージに閾
値処理を施してバイナリイメージに形成したものであ
る。非テキストイメージ71は、白領域74,75,7
6,77,78及び79と、黒領域72を含む。これら
白領域の充填率は十分に高いと想定され、ステップS1
321においてフローを再結合ステップ1322に進め
ることになる。まず最初に、図16Cに示されるよう
に、白輪郭75の上側及び下側境界が、白輪郭77の上
側及び下側境界と比較される。これらの上側及び下側境
界は一致しないので、図16Cに示されるように、白輪
郭75は白輪郭76と結合され、結合された白輪郭7
6’を生成する。
界は、白輪郭78の左右の境界と比較される。これらの
境界は同じではないので、白輪郭77と79は再結合さ
れて一つの白輪郭77’となる。
結合が生じなくなるまで繰り返される。
フトーンイメージ或いは線画のような非テキストに対す
る白輪郭がより再結合しやすいのに対して、表に対する
白輪郭は再結合されにくい。従って、ステップS132
3において、再結合率が調査される。この再結合率が高
い場合、或いは再結合後に残る白輪郭の数が4未満であ
る場合、フローはステップS1328に進み、更に詳細
に後述するように、当該非テキストユニットがハーフト
ーンイメージ或いは線画として指定されることになる。
高く、少なくとも4つの白輪郭が残った場合、フローは
ステップS1324へ進み、非テキストイメージが
“表”として指定される。ステップS1325におい
て、新たに指定された表の内部が調査され、接続コンポ
ーネントを8方向で検出し、分類する。ステップS13
26において、新しい、内部の接続コンポーネントに従
って、階層構造が更新される。ステップS1327にお
いて、内部の接続コンポーネントがテキスト或いは非テ
キストに再分類され、ステップS1302からステップ
S1304に関連して上述したようにして、適切な属性
が付与される。その後、フローはステップS1307に
戻り、次のユニットが選択される。
ステップS1321において充填率が高くない場合、或
いはステップS1323において再結合率が高い場合
は、非テキストのフレーム化されたユニットは、ハーフ
トーンイメージか線画のいずれかである可能性が高い。
ユニットがハーフトーンイメージとして分類されるか線
画として分類されるかは、当該ユニット内の黒画素の水
平方向の平均ランレングス、当該ユニット内の白画素の
水平方向の平均ランレングス、黒画素と白画素の比率、
密度に基づいて決定される。概して、非常に暗い画像は
ハーフトーンイメージとみなされ、白い明るいイメージ
は線画とみなされる。
ロに等しい(すなわち、暗い部分或いは斑点が支配的な
画像)場合、そして、ステップS1318で計算された
密度がそのユニットが白よりもより黒の傾向であること
を示す場合(すなわち、約1/2と等しい第1の閾値よ
りも大きい場合)、フレーム化されたユニットはハーフ
トーンであると決定される。また、密度が第1の閾値よ
りも大きくない場合、そのユニットは線画と判定され
る。
ロとはならず、白画素の平均ランレングスが黒画素の平
均ランレングスよりも大きい場合、そのフレーム化され
たユニットは線画であると判断される。しかし、白画素
の平均ランレングスが黒画素の平均ランレングスよりも
大きくない場合(すなわち、周期的な暗い画像)には、
更なるテストが必要となる。
も非常に少ない(すなわち、白画素の数で割られる黒画
素の数が、およそ2である第2の閾値よりも大きい)場
合、そのフレーム化されたユニットはハーフトーンユニ
ットであると判断される。一方、黒画素の数を白画素の
数で割った値が第2の閾値よりも大きくないが、ステッ
プS1318で決定された密度が第1の閾値よりも大き
い場合、そのフレーム化されたユニットはハーフトーン
イメージであると判断される。そうでない場合には、フ
レーム化されたユニットは線画であると判断される。
レーム化されたユニットが線画であると判断されると、
フローはステップS1329へ進む。ステップS132
9では、「線画」の属性が付与され、そこからステップ
S1330へ進み、全ての子孫(派生)が取り除かれ
る。詳細にいえば、ユニットが線画であると判断される
と、その線画のユニットから選択される、文字認識が可
能なブロックはない。その後、フローはステップS13
07へ戻り、次のユニットが選択される。
ーム化されたユニットが線画ではないと判断された場
合、フローはステップS1331に進む。ステップS1
331では、「ハーフトーン」の属性が付与され、そこ
からステップS1332へ進み、そのフレーム化された
ハーフトーンユニットのテキストサイズの子孫が除去さ
れる。テキストサイズはステップS1304において上
述したように、平均のユニット高さに従って決定され
る。テキストサイズの子孫よりも大きな全ての子孫は、
そのフレーム化されたハーフトーンユニットからの子孫
として残ることが許される。フローはステップS130
7に戻り、次のブロックが選択される。
が4よりも大きくない場合、そのフレーム化されたユニ
ットは表とはみなされない。従って、フローはステップ
S1333へ進み、ステップS1318で計算された密
度が、およそ0.5に等しい閾値と比較される。閾値
は、フレーム内のテキストユニット或いは線画は、画素
の半分未満しか占有しないという予測に基づいて選択さ
れる。密度が閾値よりも小さい場合、フローはステップ
S1334へ進む。ステップS1334において、フレ
ーム化されたユニットの内部構造が、上述したように構
成される。すなわち、フローは、フレーム化されたユニ
ットの内部構造のためにステップS1301に戻る。
の閾値よりも小さい場合、そのフレーム化されたユニッ
トが線画とハーフトーンイメージのいずれに分類され得
るか、或いはフレームが分類不能である(すなわち、そ
のフレームは「未知」となる)かについての判断をする
ために、フローはステップS1343に進む。
314におけるフレームフィルタリングが、非テキスト
ユニット内のフレームを検出しない場合、フローはステ
ップS1335へ進み、その非テキストユニットがライ
ンを含んでいるかどうかを判断する。ラインは、テキス
ト境界を図示するのに有用な非テキストユニットであ
る。しかし、そのようなラインによって仕切られるテキ
ストは、しばしばそのラインの近傍に現れるので、その
テキストがラインに付着してしまう可能性がある。従っ
て、ライン検出は、テキストの付属を有するラインと有
しないラインの両方を検出するように設計される。
テキストユニットのヒストグラムが、そのユニットの縦
の方向において計算される。図15Bに示されるよう
に、ラインのヒストグラム48は、ある程度均一な分布
を示し、その高さはそのラインの幅とほぼ等しい。ま
た、ラインの幅は非テキストユニットの幅(W)とほぼ
等しくなる。ここで生じるあらゆる違いは、傾斜角度θ
αによるものである。それは、画素イメージが形成され
るときに原稿が斜行している場合に、結果として生じる
ものである。従って、その非テキストユニットがライン
を含むかどうかを判断するために、ヒストグラムにおけ
る各セルcellkの高さ49が非テキストユニットの幅W
と比較される。以下のように、これらの値の二乗平均差
が閾値と比較される。
斜行或いは傾斜θαを許容するために計算されたもので
ある。1度の斜行或いは傾斜に対して、閾値を以下の式
で求めることで、満足の行く結果が得られることが見出
されている。
て見つからなかった場合は、そのユニットが付属物を有
するラインを含むかどうかについての決定がなされる。
付属物を有するラインが非テキストユニットに含まれる
かどうかを判断するために、ラインがテキストユニット
の境界に沿って長手方向に延びているかどうかについて
そのテキストユニットが調べられる。具体的には、その
ユニットをとおして長手方向にラインが延びる場合は、
図15Cに示されるように、そのユニットに外接する矩
形の境界はラインに非常に近接して存在する。従って、
その矩形の境界内に存在する黒画素の均一さが、その境
界からの距離の二乗の和を計算することで調べられる。
こうして、図15Cを参照すると、以下の不等式が試さ
れる。
場合は、付属物のついたラインが見いだされる。上記の
付属物のないラインに関して与えられたのと同じ閾値
が、満足の行く結果をもたらすことが見出されている。
出されると、フローはステップS1336を経てステッ
プS1337へ進む。ステップS1337において、
「ライン」の属性がその非テキストユニットに付与され
る。そして、フローは、ステップS1337へ進み、次
のユニットが選択される。
が検出されなかった場合、フローはステップS1336
を経てステップS1338へ進む。ステップS1338
では、その非テキストユニットのサイズが検査される。
そのサイズが所定の閾値よりも大きくない場合、その非
テキストユニットの分類は決定されない。なお、この閾
値は、最大のフォントサイズに依存して設定され、最大
フォントサイズの半分を用いると満足の行く結果が得ら
れる。従って、フローはステップS1339に進み、
「未知」の属性がその非テキストユニットに付与され
る。その後、フローはステップS1307に戻り、次の
ユニットが選択される。
定の閾値よりも大きい場合、フローはステップS134
0,S1341及びS1342に進む。ステップS13
40では、その非テキストユニットの内部白輪郭が追跡
され、ステップS1341では、その非テキストユニッ
トの密度が計算され、そしてステップS1342では、
ステップS1317,S1318及びS1319に関し
て上述したように、白輪郭の数が調査される。
が4未満の場合、フローはステップS1343に進む。
ステップS1343では、そのユニットのサイズが計算
され、そのユニットが線画或いはハーフトーンイメージ
を構成するのに十分な大きさを有するかどうかを決定す
る。このサイズ決定は、黒画素の最大ランレングスとと
もに、その非テキストユニットの高さ及び幅に基づいて
なされる。具体的には、その非テキストユニットの高さ
及び幅が最大フォントサイズよりも大きくない場合、そ
の非テキストユニットは、ハーフトーンイメージ或いは
線画と判定するには十分な大きさではない。そして、フ
ローはステップS1344に進み、「未知」の属性が付
与される。同様に、その非テキストユニットの幅が最大
フォントサイズよりも大きいが、黒画素の最大ランレン
グスが最大フォントサイズよりも大きくない場合も、フ
ローはステップS1344に進み、「不明」の属性が与
えられる。フローはその後、ステップS1307に戻
り、新しいユニットが選択される。
トユニットが線画或いはハーフトーンイメージのいずれ
かであるのに十分な大きさを有する場合、フローはステ
ップS1345に進み、その非テキストユニットが線画
であるかハーフトーンイメージであるかを決定する。ス
テップS1345からステップS1349は、ステップ
S1328からステップS1332とそれぞれ同様のも
のであり、それらの説明は省略する。
ドキュメントが高解像度でスキャンされる。その結果と
して得られた高解像度画素データが出力イメージを生成
するのに用いられるので、高解像度データであることが
低解像度データよりも望ましい。本発明の他の態様にお
いて、ステップS401でドキュメントが高解像度でス
キャンされ、ステップS402において後続のブロック
セレクション処理のために低解像度に変換されるように
してもよい。ステップS401で高解像度スキャンを行
なうこの他の態様においては、ステップS404は実行
されないことになる。
取得された後、そのデータは、エッジ検出器115及び
色度判定ユニット116を用いるとともに、検出された
オブジェクト属性やフォントサイズを用いて処理され
る。
4の信号は、入力マスキングユニット106においてマ
スキング変換されており、黒文字判定ユニット113の
エッジ検出器115に入力される。図6は、エッジ検出
器の内部構成を示すブロック図である。最初に、輝度信
号Yが、輝度計算回路250により、R4,G4及びB
4に基づいて計算される。図7は、回路250の詳細な
回路構成を示す図である。
G,Bのそれぞれには、乗算器301,302,303
によって、係数0.25,0.50,0.25が乗算さ
れる。そして、取得された値は加算器304,305に
おいて加算される。従って、輝度信号Yは、 Y=0.25R+0.5G+0.25B なる等式を用いて計算されることになる。
小方向検出器251はその信号を3つのラインに展開す
る。図8は、検出器251のFIFO401,402を
示す。FIFO401,402の各々は1ライン分の遅
延をもたらす。これら3つのラインは、周知のラプラシ
アンフィルタ403〜406によってフィルタされる。
そして、図8に示されるように、検出器251は、フィ
ルタから出力されるエッジコンポーネントの量の絶対値
が最小となる方向を決定する。決定された方向はエッジ
方向として指定される。
ト252において、スムージング処理が、輝度信号Yに
対して、エッジ最小方向について適用される。スムージ
ング処理を適用することにより、そのエッジコンポーネ
ントを、そのエッジコンポーネントが最大である方向に
維持することが可能となり、そのエッジコンポーネント
を他の方向に平滑化(スムージング)することができ
る。
ポーネントを有する文字/ラインについては、その特性
が維持される一方で、複数の方向に大きなエッジコンポ
ーネントを有するドットコンポーネントに対して、エッ
ジコンポーネントがエッジ検出器115によって平滑化
される。なお、この処理を必要な回数だけ繰り返すこと
により、ラインコンポーネントはドットコンポーネント
からより効果的に分離される。これにより、スクリーン
ドットに含まれる文字コンポーネントを検出することが
可能となる。
上述のラプラシアンフィルタによってフィルタされ、エ
ッジ量の絶対値が値a以下である信号を排除する。結果
として、エッジ量の絶対値が値aよりも大きい信号が、
論理「1’s」として出力される。図9A、9Bは、エ
ッジ検出の例を示す図である。ここで、図9Aにおける
輝度データYのイメージデータは図9Bにおいて示され
るエッジ検出信号として出力される。
ちのいずれかを表す3ビットの「エッジ(edge)」信号
を出力する。そのコードは、エッジが、注目画素の周り
の7×7のブロックサイズのマスク、5×5のブロック
サイズのマスク或いは3×3のブロックサイズのマスク
を用いて注目画素の周りで見出された、マスクなしで注
目画素の周りに見出された、或いはエッジがその注目画
素の周りには見つからなかったことを表す。換言すれ
ば、「エッジ」信号は、合計で5種類の情報を含む3ビ
ットコードであり、その情報はすなわち、エッジ画素と
して検出される画素が、注目画素の周囲の7×7画素ブ
ロック内に存在する、5×5画素ブロック内に存在す
る、3×3画素ブロック内に存在する、注目画素を含む
全てのブロックに存在する、そして注目画素がエッジ画
素と判断されるか否かに関するものである。
すブロック図である。最大値検出器601と最小値検出
器602において、最大値であるmax(R,G,B)
と最小値であるmin(R,G,B)がそれぞれ入力さ
れたカラー信号R4,G4,B4から抽出される。そし
て、その差分、ΔC=max(R,G,B)−min
(R,G,B)が減算器603によって計算される。次
に、LUT604において、図11に示した特性に従っ
たデータ変換が遂行され、色度信号Crが生成される。
づく)に従って、ΔCの値がゼロに近づき、一方、色度
が高くなるに従って、ΔCの値が増加することが示され
ている。言い換えれば、色の非色度が大きくなるに従っ
てCrは大きな値を有し、色度が大きくなるに従ってC
rはゼロに近づく。なお、図3において色度決定回路1
16から出力される信号“col”は、“colo
r”、“black”、“gray”(“color”
と“black”の中間のカラーを表す)、或いは“w
hite”を2ビットコードを用いて表したものであ
る。
をブロックセレクションユニット200から受けとり、
エッジ信号をエッジ検出器115から受け取り、col
信号を色度決定回路116から受け取る。LUT205
は、これらを受けて、UCR、FILTER、SENを
出力する。これらが有する値は、本願明細書の発明の背
景の項で説明したとおりである。しかしながら、本発明
によれば、UCR、FILTER、SENの信号は、L
UT205と、上述のフォントサイズ(font size)、
属性(attribute)、エッジ(edge)及びcol信号の
内容に基づいたものである。
である。図示のように、LUT205は、col、属性
(attribute)、フォントサイズ(font size))及びエ
ッジ(edge)の各信号に基づいて、対応するUCR,F
ILTER及びSENの値を割り当てる。こうして、ブ
ロックセレクションユニット200から出力された信号
により、LUT205の内容は、注目画素データにより
適切な処理を提供するために特定され得る。たとえば、
図1の文字太さ判定回路114では、注目画素が存在す
る領域のタイプを表わすことを意図する出力信号を生成
する。本実施形態では、ブロックセレクションユニット
200を用いて、その領域内のテキストサイズと共に、
領域のより正確な判定が得られる。従って、より正確な
処理がその領域について遂行され得る。
は、テキスト画素及びエッジ画素であると判定された注
目画素に対してシャープ化処理(FILTER=1)を
実行すること、注目画素がテキスト画素であるともエッ
ジ画素であるとも判定されなかった場合にその注目画素
に平滑化(スムージング)処理(FILTER=3)を
実行することである。加えて、テキスト画素であってエ
ッジ画素ではないと判定された画素に対して、その画素
はテキスト文字の内部の領域の一部であると仮定され、
従って、その画素に対して内部平滑化処理(FILTE
R=0)が実行される。他の例において、非テキスト領
域内の画素に対しては、全体的に平滑化処理(FILT
ER=3)が実行される。もちろん、平滑化処理の他の
組み合わせ、下色除去及び選択された印刷解像度が、本
発明に従って、採用され得る。それらの多くは、図12
において示される値によって図解されている。
望ましい実施形態と考えられるものについて説明した
が、本発明が上述したものに限定されないことはいうま
でもない。反対に、本発明は、添付のクレームの精神と
範囲の中に含まれる種々の改良や等価な構成をカバーす
るべく意図するものである。
の流れを示すブロック図である。
である。
図である。
理ステップを示すフローチャートである。
ドキュメントを示す図である。
図である。
ィルタを示す図である。
特性を説明する図である。
を説明する図である。
を説明する図である。
を説明する図である。
を説明する図である。
を説明する図である。
を説明する図である。
を説明する図である。
どのようにして分類されるかを説明するフローチャート
である。
どのようにして分類されるかを説明するフローチャート
である。
どのようにして分類されるかを説明するフローチャート
である。
明する図である。
明する図である。
明する図である。
Claims (21)
- 【請求項1】 イメージデータを入力し、 入力したイメージデータ内の画素のタイプを判断するた
めに、該イメージデータに対してブロックセレクション
処理を実行し、 前記ブロックセレクション処理に基づいて、注目画素デ
ータがテキスト画素を表すかどうかを判断する第1判断
ステップと、 前記注目画素データがエッジ画素を表すかどうかを判断
する第2判断ステップと、 前記注目画素がテキスト画素及びエッジ画素を表すと判
断された場合に、該注目画素に第1の処理を実行し、 前記注目画素がテキスト画素及びエッジ画素を表すと判
断されなかった場合に、該注目画素に第2の処理を実行
することを特徴とする画像処理方法。 - 【請求項2】 前記入力ステップは、 第1の解像度のイメージデータを入力する予備走査ステ
ップと、 前記第1の解像度よりも高い第2の解像度のイメージデ
ータを入力する走査ステップとを備え、 前記ブロックセレクション処理は前記第1の解像度のイ
メージデータについて実行され、 前記第2の判断ステップは前記第2の解像度のイメージ
データについて実行されることを特徴とする請求項1に
記載の画像処理方法。 - 【請求項3】 前記入力ステップが、 第1の解像度のイメージデータを入力する予備走査ステ
ップと、 前記第1の解像度よりも高い第2の解像度のイメージデ
ータを入力する走査ステップとを備え、 前記ブロックセレクション処理は前記第1の解像度のイ
メージデータについて実行され、 前記第1及び第2の処理は前記第2の解像度のイメージ
データについて実行されることを特徴とする請求項1に
記載の画像処理方法。 - 【請求項4】 前記第1の処理がシャープ化処理であ
り、前記第2の処理がスムージング処理であることを特
徴とする請求項1に記載の画像処理方法。 - 【請求項5】 前記注目画素データがハーフトーン画素
を表しているかどうかを判断する第3の判断ステップ
と、 前記注目画素がハーフトーン画素を表すと判断された場
合に、該注目画素データに第3の処理を実行するステッ
プとを更に備えることを特徴とする請求項1に記載の画
像処理方法。 - 【請求項6】 前記ブロックセレクションを実行するス
テップは、前記入力されたイメージデータ内のテキスト
文字のサイズを判断するステップを備えることを特徴と
する請求項1に記載の画像処理方法。 - 【請求項7】 前記画素データのタイプは、ハーフトー
ンのテキスト、ラインアート、ライン、タイトル、テー
ブル、ハーフトーン、フレーム及び背景を含むことを特
徴とする請求項1に記載の画像処理方法。 - 【請求項8】 プロセッサ可読媒体に格納されたプロセ
ッサによる実行が可能な処理ステップであって、 イメージデータを入力する入力ステップと、 入力したイメージデータ内の画素のタイプを判断するた
めに、該イメージデータに対してブロックセレクション
処理を実行する実行ステップと、 前記ブロックセレクション処理に基づいて、注目画素デ
ータがテキスト画素を表すかどうかを判断する第1判断
ステップと、 前記注目画素データがエッジ画素を表すかどうかを判断
する第2判断ステップと、 前記注目画素がテキスト画素及びエッジ画素を表すと判
断された場合に、該注目画素に第1の処理を実行する処
理ステップと、 前記注目画素がテキスト画素及びエッジ画素を表すと判
断されなかった場合に、該注目画素に第2の処理を実行
する処理ステップとを備えることを特徴とするプロセッ
サによる実行が可能な処理ステップ。 - 【請求項9】 前記入力ステップは、 第1の解像度のイメージデータを入力する予備走査ステ
ップと、 前記第1の解像度よりも高い第2の解像度のイメージデ
ータを入力する走査ステップとを備え、 前記ブロックセレクション処理は前記第1の解像度のイ
メージデータについて実行され、 前記第2の判断ステップは前記第2の解像度のイメージ
データについて実行されることを特徴とする請求項8に
記載のプロセッサによる実行が可能な処理ステップ。 - 【請求項10】 前記入力ステップが、 第1の解像度のイメージデータを入力する予備走査ステ
ップと、 前記第1の解像度よりも高い第2の解像度のイメージデ
ータを入力する走査ステップとを備え、 前記ブロックセレクション処理は前記第1の解像度のイ
メージデータについて実行され、 前記第1及び第2の処理は前記第2の解像度のイメージ
データについて実行されることを特徴とする請求項8に
記載のプロセッサによる実行が可能な処理ステップ。 - 【請求項11】 前記第1の処理がシャープ化処理であ
り、前記第2の処理がスムージング処理であることを特
徴とする請求項8に記載のプロセッサによる実行が可能
な処理ステップ。 - 【請求項12】 前記注目画素データがハーフトーン画
素を表しているかどうかを判断する第3の判断ステップ
と、 前記注目画素がハーフトーン画素を表すと判断された場
合に、該注目画素データに第3の処理を実行する処理ス
テップとを更に備えることを特徴とする請求項8に記載
のプロセッサによる実行が可能な処理ステップ。 - 【請求項13】 前記ブロックセレクションを実行する
ステップは、前記入力されたイメージデータ内のテキス
ト文字のサイズを判断するステップを備えることを特徴
とする請求項8に記載のプロセッサによる実行が可能な
処理ステップ。 - 【請求項14】 前記画素データのタイプは、ハーフト
ーンのテキスト、ラインアート、ライン、タイトル、テ
ーブル、ハーフトーン、フレーム及び背景を含むことを
特徴とする請求項8に記載のプロセッサによる実行が可
能な処理ステップ。 - 【請求項15】 イメージデータを入力する手段と、 前記入力したイメージデータ内の画素のタイプを判断す
るために、該イメージデータに対してブロックセレクシ
ョン処理を実行する手段と、 前記ブロックセレクション処理に基づいて、注目画素デ
ータがテキスト画素を表すかどうかを判断する第1判断
手段と、 前記注目画素データがエッジ画素を表すかどうかを判断
する第2判断手段と、 前記注目画素がテキスト画素及びエッジ画素を表すと判
断された場合に、該注目画素に第1の処理を実行する手
段と、 前記注目画素がテキスト画素及びエッジ画素を表すと判
断されなかった場合に、該注目画素に第2の処理を実行
する手段とを備えることを特徴とする画像処理装置。 - 【請求項16】 前記入力する手段は、第1の解像度の
イメージデータを入力する手段と、 前記第1の解像度よりも高い第2の解像度のイメージデ
ータを入力する手段とを備え、 前記ブロックセレクション処理は前記第1の解像度のイ
メージデータについて実行され、 前記第2の判断手段は前記第2の解像度のイメージデー
タについて動作することを特徴とする請求項15に記載
の画像処理装置。 - 【請求項17】 前記入力する手段が、 第1の解像度のイメージデータを入力する手段と、 前記第1の解像度よりも高い第2の解像度のイメージデ
ータを入力する手段とを備え、 前記ブロックセレクション処理は前記第1の解像度のイ
メージデータについて実行され、 前記第1及び第2の処理は前記第2の解像度のイメージ
データについて実行されることを特徴とする請求項15
に記載の画像処理装置。 - 【請求項18】 前記第1の処理がシャープ化処理であ
り、前記第2の処理がスムージング処理であることを特
徴とする請求項15に記載の画像処理装置。 - 【請求項19】 前記注目画素データがハーフトーン画
素を表しているかどうかを判断する第3判断手段と、 前記注目画素がハーフトーン画素を表すと判断された場
合に、該注目画素データに第3の処理を実行する手段と
を更に備えることを特徴とする請求項15に記載の画像
処理装置。 - 【請求項20】 前記ブロックセレクションを実行する
手段は、前記入力されたイメージデータ内のテキスト文
字のサイズを判断することを特徴とする請求項15に記
載の画像処理装置。 - 【請求項21】 前記画素データのタイプは、ハーフト
ーンのテキスト、ラインアート、ライン、タイトル、テ
ーブル、ハーフトーン、フレーム及び背景を含むことを
特徴とする請求項15に記載の画像処理装置。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/458941 | 1999-12-10 | ||
US09/458,941 US6718059B1 (en) | 1999-12-10 | 1999-12-10 | Block selection-based image processing |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001274990A true JP2001274990A (ja) | 2001-10-05 |
JP2001274990A5 JP2001274990A5 (ja) | 2008-01-31 |
JP4405663B2 JP4405663B2 (ja) | 2010-01-27 |
Family
ID=23822720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000376263A Expired - Fee Related JP4405663B2 (ja) | 1999-12-10 | 2000-12-11 | 画像処理方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6718059B1 (ja) |
JP (1) | JP4405663B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11830162B2 (en) | 2018-12-05 | 2023-11-28 | Samsung Electronics Co., Ltd. | Image processing apparatus configured to perform edge preserving smoothing and image processing method thereof |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4424845B2 (ja) * | 1999-12-20 | 2010-03-03 | 本田 正 | イメージデータ圧縮方法及び復元方法 |
JP4105367B2 (ja) * | 2000-05-11 | 2008-06-25 | 富士フイルム株式会社 | 色変換装置および色変換プログラム記憶媒体 |
JP2004005211A (ja) * | 2002-05-31 | 2004-01-08 | Toshiba Corp | 情報処理装置 |
JP4387907B2 (ja) * | 2003-11-21 | 2009-12-24 | キヤノン株式会社 | 画像処理方法及び装置 |
JP2007188474A (ja) * | 2005-12-12 | 2007-07-26 | Ricoh Co Ltd | ユーザインタフェース装置、項目設定方法およびプログラム |
US7889932B2 (en) * | 2006-03-02 | 2011-02-15 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US8630498B2 (en) * | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
US7792359B2 (en) | 2006-03-02 | 2010-09-07 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
JP4135752B2 (ja) * | 2006-06-12 | 2008-08-20 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
US8437054B2 (en) * | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
US7864365B2 (en) * | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
JP4706581B2 (ja) * | 2006-07-14 | 2011-06-22 | 富士ゼロックス株式会社 | 画像処理装置および画像形成装置 |
US7876959B2 (en) * | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
US20090041344A1 (en) * | 2007-08-08 | 2009-02-12 | Richard John Campbell | Methods and Systems for Determining a Background Color in a Digital Image |
US8989493B1 (en) * | 2012-02-06 | 2015-03-24 | Marvell International Ltd. | Method and apparatus for identifying regions of an image to be filtered during processing of the image |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2872285B2 (ja) | 1989-08-02 | 1999-03-17 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
JPH0722330B2 (ja) | 1990-01-10 | 1995-03-08 | 富士ゼロックス株式会社 | 画像処理装置の画像領域識別方式 |
DE69118939T2 (de) | 1990-02-06 | 1996-11-14 | Canon Kk | Bildverarbeitungsgerät |
US5696842A (en) * | 1991-07-04 | 1997-12-09 | Ricoh Company, Ltd. | Image processing system for adaptive coding of color document images |
US5452374A (en) * | 1992-04-06 | 1995-09-19 | Ricoh Corporation | Skew detection and correction of a document image representation |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JPH0750752A (ja) | 1993-08-06 | 1995-02-21 | Fuji Xerox Co Ltd | 画像密度変換方法及び装置 |
JP3599367B2 (ja) | 1993-12-29 | 2004-12-08 | キヤノン株式会社 | 画像処理装置およびその方法 |
US5729360A (en) | 1994-01-14 | 1998-03-17 | Fuji Xerox Co., Ltd. | Color image processing method and system |
US5715377A (en) | 1994-07-21 | 1998-02-03 | Matsushita Electric Industrial Co. Ltd. | Gray level correction apparatus |
TW367447B (en) | 1994-12-21 | 1999-08-21 | Canon Kk | Block selection review and editing system |
JP3343457B2 (ja) * | 1994-12-22 | 2002-11-11 | 京セラミタ株式会社 | 画像処理装置 |
JPH08331398A (ja) | 1995-05-31 | 1996-12-13 | Canon Inc | 画像処理システム及びコントローラ |
US5774579A (en) | 1995-08-11 | 1998-06-30 | Canon Kabushiki Kaisha | Block selection system in which overlapping blocks are decomposed |
US5848186A (en) | 1995-08-11 | 1998-12-08 | Canon Kabushiki Kaisha | Feature extraction system for identifying text within a table image |
US5778092A (en) * | 1996-12-20 | 1998-07-07 | Xerox Corporation | Method and apparatus for compressing color or gray scale documents |
JPH11143986A (ja) * | 1997-10-17 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体 |
-
1999
- 1999-12-10 US US09/458,941 patent/US6718059B1/en not_active Expired - Fee Related
-
2000
- 2000-12-11 JP JP2000376263A patent/JP4405663B2/ja not_active Expired - Fee Related
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11830162B2 (en) | 2018-12-05 | 2023-11-28 | Samsung Electronics Co., Ltd. | Image processing apparatus configured to perform edge preserving smoothing and image processing method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP4405663B2 (ja) | 2010-01-27 |
US6718059B1 (en) | 2004-04-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7724950B2 (en) | Image processing apparatus, image processing method, computer program, and storage medium | |
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
JP4405663B2 (ja) | 画像処理方法及び装置 | |
US7428331B2 (en) | Page background estimation using color, texture and edge features | |
US6377711B1 (en) | Methods and systems for detecting the edges of objects in raster images using diagonal edge detection | |
JP2007504719A (ja) | 組み込みアプリケーションに適した、画像における赤目の検出と補正を行うシステム及び方法 | |
JP7447193B2 (ja) | 画像処理装置及び画像処理方法 | |
JPH0435167A (ja) | 線画分離方法および装置 | |
KR101224936B1 (ko) | 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체 | |
JP3886727B2 (ja) | 画像処理装置 | |
JP4111190B2 (ja) | 画像処理装置 | |
JP4140519B2 (ja) | 画像処理装置、プログラムおよび記録媒体 | |
JP4502001B2 (ja) | 画像処理装置および画像処理方法 | |
JPH1188664A (ja) | 画像処理装置、および、そのプログラムを記録した記録媒体 | |
JP2003189096A (ja) | 画像処理装置 | |
US6661921B2 (en) | Image process apparatus, image process method and storage medium | |
US8330997B2 (en) | Image processing apparatus, image forming apparatus and image processing method | |
US6947595B2 (en) | System for processing object areas of an image | |
JP3830350B2 (ja) | カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体 | |
JP4084537B2 (ja) | 画像処理装置、画像処理方法および記録媒体並びに画像形成装置 | |
JPH11136505A (ja) | 画像処理装置およびその方法 | |
JP3966448B2 (ja) | 画像処理装置、画像処理方法、該方法を実行するプログラムおよび該プログラムを記録した記録媒体 | |
JP2006107018A (ja) | 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム | |
JP4035696B2 (ja) | 線分検出装置及び画像処理装置 | |
JP2004048130A (ja) | 画像処理方法、画像処理装置、および画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071211 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071211 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20071211 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121113 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131113 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |