JP4405663B2 - 画像処理方法及び装置 - Google Patents
画像処理方法及び装置 Download PDFInfo
- Publication number
- JP4405663B2 JP4405663B2 JP2000376263A JP2000376263A JP4405663B2 JP 4405663 B2 JP4405663 B2 JP 4405663B2 JP 2000376263 A JP2000376263 A JP 2000376263A JP 2000376263 A JP2000376263 A JP 2000376263A JP 4405663 B2 JP4405663 B2 JP 4405663B2
- Authority
- JP
- Japan
- Prior art keywords
- text
- attribute
- image data
- resolution
- edge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000003672 processing method Methods 0.000 title claims description 10
- 238000012545 processing Methods 0.000 claims description 68
- 238000000034 method Methods 0.000 claims description 38
- 238000001514 detection method Methods 0.000 claims description 17
- 238000003708 edge detection Methods 0.000 claims description 15
- 238000001914 filtration Methods 0.000 claims description 9
- 238000004590 computer program Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 30
- 238000009499 grossing Methods 0.000 description 8
- 238000005215 recombination Methods 0.000 description 7
- 230000006798 recombination Effects 0.000 description 7
- 230000000873 masking effect Effects 0.000 description 5
- 238000013459 approach Methods 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000003705 background correction Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 229910052736 halogen Inorganic materials 0.000 description 2
- 150000002367 halogens Chemical class 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 241000284156 Clerodendrum quadriloculare Species 0.000 description 1
- 238000004042 decolorization Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 230000003111 delayed effect Effects 0.000 description 1
- 239000000284 extract Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- 230000012447 hatching Effects 0.000 description 1
- 238000010191 image analysis Methods 0.000 description 1
- 238000010348 incorporation Methods 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 238000007670 refining Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000009827 uniform distribution Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/40—Picture signal circuits
- H04N1/40062—Discrimination between different image types, e.g. two-tone, continuous tone
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/41—Analysis of document content
- G06V30/413—Classification of content, e.g. text, photographs or tables
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration using local operators
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/70—Denoising; Smoothing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/73—Deblurring; Sharpening
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10004—Still image; Photographic image
- G06T2207/10008—Still image; Photographic image from scanner, fax or copier
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/10—Image acquisition modality
- G06T2207/10024—Color image
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20004—Adaptive image processing
- G06T2207/20012—Locally adaptive
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20172—Image enhancement details
- G06T2207/20192—Edge enhancement; Edge preservation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30176—Document
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- Signal Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Image Processing (AREA)
- Image Input (AREA)
- Image Analysis (AREA)
Description
【発明の分野】
本発明は画素データを処理するシステムに関する。更に詳しくは、本発明は、入力された画素データの検出された特徴に基づいて画素データが処理される画像処理システムに関する。
【0002】
【参照による組み込み】
本願と共通の譲り受け人による、米国特許第5,680,479号(名称は「文字認識方法及び装置」、米国特許出願番号07/873,012)と、米国特許第5,588,072号(名称は「格納されたドキュメントにおけるテキスト及び・又は非テキストブロックを選択するための方法及び装置、米国特許出願番号08/171,720)と、米国特許出願第08/338,781(名称は「ページ解析システム」)と、米国特許第5,774,579号(名称は「オーバラップするブロックが分解されるブロックセレクションシステム」、米国特許出願番号08/514,250)と、米国特許第5,848,186号(名称は「特徴抽出システム」、米国特許出願番号08/514,252)と、米国特許出願番号08/664,674(名称は「付属されたテキストを抽出するシステム」)と、米国特許出願番号08/751,677(名称は「ページ解析システム」)と、米国特許第5,825,944号(名称は「ブロックセレクションのレビュー及び編集システム、米国特許出願番号08/834,856)と、米国特許出願番号09/002,684(名称は「テーブルイメージの解析システム」)と、米国特許出願番号09/161,716(名称は「カラーブロックセレクション」)と、米国特許出願番号09/222,860(名称は「テーブル特徴のブロックセレクション」)とは、その全てが記載されているものとして本願に組み込まれる。
【0003】
【背景技術の説明】
カラー複写機のような一般的な画像処理システムは、原稿文書を走査することによって画素データを取得し、レーザビーム方式の再生エンジンや、インクジェット方式の再生システム等への受け渡しに適した出力データを生成するために、そのデータに対して種々の画像処理ステップを実行する。特に、一般的な画像処理システムでは、まず、電化結合素子(CCD)から走査された画像を表す赤(R)、緑(G)及び青(B)の信号が受信される。受信された信号は、次いで、画像処理に提供される。
【0004】
図1はそのような画像処理を説明する図である。図1に示されるように、CCDから出力された画像信号はアナログ信号処理ユニット101に入力される。ここで、その信号は、ゲイン及びオフセットが調整される。次に、R,G及びBの各信号は、A/D変換器102によって、それぞれ8ビットのデジタル画像信号R1,G1及びB1に変換される。そして、これらの信号は、シェーディング補正回路103に入力され、各信号に対してシェーディング補正が適用される。ライン遅延回路104及び105はCCD内のセンサを空間的に補償するのに用いられる。この補償により、R1,G1及びB1の各信号間のタイミングを整合させ、ライン遅延回路105以降では、同時刻におけるR,G及びBの信号が同一画素を表すようになる。
【0005】
入力マスキングユニット106は、CCDの色分解特性によって決定される読み取り色空間を、標準の色空間に変換する。ログ変換器107は輝度信号R4,G4及びB4を濃度信号C0,M0及びY0に変換する。そして、UCR(下色除去)、FILTER及びSENの各信号が生成されて決定されるまでの間、濃度信号はライン遅延メモリ108によって遅延される。
【0006】
ライン遅延メモリ108による信号の遅延の後に、マスキングUCR回路109はUCR信号を用いて上記濃度信号から黒信号を抽出する。可変変倍回路110は主走査方向に、画像信号及び黒文字判定信号を拡大、縮小する。空間フィルタ処理ユニット111は、FILTER信号を用いてフィルタリングを実行し、その結果として得られるフレーム順の画像信号M4,C4,Y4及びBk4が、SEN信号とともに再生エンジン112に送られる。ここで、SENは、画像出力される際の解像度を決定する。
【0007】
上記一般的な画像処理システムによれば、上記UCR、FILTER及びSEN信号は、黒文字検出ユニット115より出力される。特に、黒信号検出ユニット113によって生成されたUCR信号は、黒から薄くなる順に0〜7の値を有し、マスキングUCR回路109が黒信号Bk2を生成するために、信号Y1,M1及びC1から除去するべき黒成分の量を示す。黒文字判定回路113によって生成されたFILTER信号は、スムージング、強エッジ強調、中エッジ強調、弱エッジ強調のそれぞれを表す値0,1,2及び3を示す2ビット値である。したがって、FILTER信号は、信号Y3,M3,C3及びBk3に適用されるフィルタリングの度合い及びタイプを制御するために、空間フィルタ処理ユニット111に入力される。
【0008】
SEN信号は黒文字判定回路113から再生エンジン112に出力される。このSEN信号において、値0は200ライン/インチでプリントを処理することを示し、値1は、400ライン/インチのプリント処理を要求することを示す。
【0009】
UCR,FILTER及びSENの値はルックアップテーブル(LUT)117の出力である。LUT117は、注目画素を含む文字の幅、注目画素の文字のエッジへの近接度、注目画素の色度を表す信号を受信する。したがって、UCR,FILTER及びSENの各出力値は各注目画素について計算され、LUTによって特定される関係に従って、その画素に対応して検出された文字幅、エッジ近接度及び色度に基づいて決定される。
【0010】
たとえば、FILTER信号値1は、エッジの近くに配置され、低い色度を有し、比較的細い文字に含まれるような注目画素について用いられる。そのようなファクタは、その画素が小さな、黒文字内にあることを示すからである。他の例において、その注目画素がエッジの近くではなく、非常に濃い領域に含まれている場合、SEN信号に値0(200ライン/インチの解像度に対応)が割り当てられる。大きなドットよりも単位ユニット領域あたりにより多くのトナーを提供する、より大きなトナードットが、より良好なハーフトーンイメージを生成するからである。
【0011】
上述からわかるように、一般的な画像処理システムは、画素に対する適切な処理パラメータを決定するために、いくつかのファクターに基づいて注目画素の性質を「推測」する。そのようなアプローチのひとつの短所は、推測された性質が間違っていた場合、その画素に不適切な処理が実行されてしまうことである。
【0012】
上記に鑑み、必要であることは、入力画像データの正確で安価に、検出された属性を使用してイメージ処理を改良する画像処理システムである。
【0013】
【課題を解決するための手段】
本発明の一態様による画像処理方法は、
画像処理装置による画像処理方法であって、
第1の解像度でドキュメントをスキャンして、低解像度の画像データを得る第1入力工程と、
前記低解像度の画像データを解析して、前記ドキュメントに含まれるオブジェクトを検出し、該オブジェクトのサイズに基づいて該オブジェクトの属性がテキスト属性であるか否かを識別し、該オブジェクトの属性がテキスト属性である場合は該オブジェクトにおけるテキストのフォントサイズを識別する識別工程と、
前記ドキュメントを前記第1の解像度よりも高い第2の解像度でスキャンして、高解像度の画像データを得る第2入力工程と、
前記高解像度の画像データからエッジを検出するエッジ検出工程と、
前記高解像度の画像データから各画素の色度を検出する色度検出工程と、
前記識別工程で識別された属性とフォントサイズ、前記エッジ検出工程で検出されたエッジ、及び前記色度検出工程で検出された色度に基づいて黒生成処理および空間フィルタ処理を決定し、決定された黒生成処理および空間フィルタ処理を前記高解像度の画像データに実行する処理工程とを有する。
【0014】
また、本発明の他の態様による画像処理装置は以下の構成を備える。すなわち、
スキャナを用いて第1の解像度でドキュメントをスキャンして、低解像度の画像データを得る第1入力手段と、
前記低解像度の画像データを解析して、前記ドキュメントに含まれるオブジェクトを検出し、該オブジェクトのサイズに基づいて該オブジェクトの属性がテキスト属性であるか否かを識別し、該オブジェクトの属性がテキスト属性である場合は該オブジェクトにおけるテキストのフォントサイズを識別する識別手段と、
前記スキャナを用いて前記ドキュメントを前記第1の解像度よりも高い第2の解像度でスキャンして、高解像度の画像データを得る第2入力手段と、
前記高解像度の画像データからエッジを検出するエッジ検出手段と、
前記高解像度の画像データから各画素の色度を検出する色度検出手段と、
前記識別手段で識別された属性とフォントサイズ、前記エッジ検出手段で検出されたエッジ、及び前記色度検出手段で検出された色度に基づいて黒生成処理および空間フィルタ処理を決定し、決定された黒生成処理および空間フィルタ処理を前記高解像度の画像データに実行する処理手段とを備える。
【0019】
【発明の実施の形態】
図2は本発明に係る一実施形態による画像処理装置の断面を示す図である。図2の装置において、イメージスキャナ201は原稿文書を読み取り、読み取った原稿の画素データにデジタル処理を施してディジタル信号とする。プリンタ218は、イメージスキャナ201によって読み取られた原稿文書に対応するイメージを、印刷用紙上にフルカラーでプリントする。
【0020】
イメージスキャナ201において、原稿文書204はプラテンガラス上にセットされ、原稿カバー202でもってカバーされ、ハロゲンランプ205によって露光される。原稿文書204からの反射光は、更にミラー206及び207によって反射され、レンズ208を通過した後に、R,G及びB信号を特定するためのCCD210にフォーカスする。なお、レンズ208は赤外線フィルタ231によってカバーされている。
【0021】
好ましい実施形態において、それぞれの色成分を読み取るためのCCD210における各センサの行は、5000画素からなる。こうして、CCD210は、A3サイズの短辺長、すなわち297mmの長さに渡って、400dpiの解像度で読み取ることができる。CCD210は原稿文書のカラー情報を、R,G及びBの色成分のフルカラー情報へ分離し、そのフルカラー情報を色信号へ変換する。
【0022】
更に、標準白板211は、CCD210のR,G,Bフォトセンサ210−1〜210−3による読み取りデータを校正するための校正データを生成する。この標準白板211は、可視光領域において均一な反射特性を有しており、白色に見える。データを校正した後、CCD210は信号を信号処理ユニット209へ送る。
【0023】
なお、ハロゲンランプ205とミラー206は速度vで移動し、ミラー207は速度1/2vで移動する。これらの移動方向は、CCD210の電気的走査方向(主走査方向)に対して直角な方向である。原稿文書204の全領域は、この方法で走査される。
【0024】
更に、信号処理ユニット209において、読み取り信号は電気的に処理され、マゼンタ(M)、シアン(C)、イエロー(Y)及び黒(Bk)の色成分に分離され、プリンタ218に送られる。イメージスキャナ201による各走査動作に対して、色成分データM,C,Y及びBkのうちの一つがプリンタ218に送られる。こうして、原稿文書204を4回走査することによって、一つのカラー画像が形成される。
【0025】
プリンタ218において、イメージスキャナ201からのM,C,Y及びBkの各色信号は、レーザドライバ212に送られる。レーザドライバ212は、画像信号に基づいて変調された信号によって半導体レーザ213を駆動する。レーザビームは、ポリゴンミラー214、f−θレンズ215及びミラー216を介して、静電ドラム217を走査する。
【0026】
現像ユニットはマゼンタ現像器219、シアン現像器220、イエロー現像器221、及び黒現像器222からなる。これら4つのドラムは、静電ドラム217と接触し、それによって回転し、静電ドラム217上に形成されたM,C,Y及びBkの潜像を対応する色のトナーで現像する。更に、転写ドラム223は、用紙カセット224或いは225から供給された記録紙を吸着して、静電ドラム217上に現像されたトナーイメージをその用紙上に転写させる。そしてその用紙は、定着ユニット226を通過した後に排出される。
【0027】
図3は本発明に従った画像処理フローを示すブロック図である。図3に示される構成で、図1に示したのと同一の参照番号を有するものは、図1に関して上述したように動作する。さて、図3では、フォントサイズと属性を表す信号を出力するブロックセレクションユニット200が示されている。ブロックセレクションユニット200は、図3においてハードウエアユニットとして示されているが、ここで説明されるブロックセレクション処理と、ここで参照によって組み込まれるアプリケーションにおいて説明されるブロックセレクション処理は、ソフトウエアによって実現されてもよいし、ソフトウエアとハードウエアのコンビネーションによって実現されてもよい。更に、ブロックセレクションユニット200は黒文字検出ユニット113のエレメントでなくともよい。
【0028】
動作において、ブロックセレクションユニット200は入力された画像データに対してブロックセレクション処理を実行し、そのデータ内のオブジェクトの属性とともに、そのデータ内のテキストのフォントサイズを決定する。更に詳細には、ブロックセレクションユニット200は、入力された画像データの各画素に対してその画素が配置されているオブジェクトの属性を割り当てるとともに、もしその画素がテキスト内にあるのならば当該テキストのフォントサイズを割り当てる。
【0029】
また、図3には、LUT117とは異なる内容を有するLUT205が示されている。LUT205について概要を述べれば、LUT205はフォントサイズ(font size)、属性(attribute)、エッジ(edge)及びcolを入力信号とし、UCR,FILTER及びSENを出力信号とするものである。LUT205の詳細な内容は後述する。
【0030】
図4は、本発明に従って画素データを処理する処理ステップのフローチャートである。フローはステップS401から始まり、ここでまず、文書が低解像度でスキャンされる。好適な実施形態においては、図2に関して上述したように、そのようなスキャニングがイメージスキャナ201によって実行されることになる。もちろん、ステップS401において、文書をスキャンするための他のシステムを用いることも可能である。一般的に低解像度のスキャンは高解像度のスキャンよりもより高速に動作するので、ステップS401においては、処理時間を減らすために文書が低解像度でスキャンされる。加えて、出願人は、低解像度画素データは、これに続くブロックセレクション処理に供された場合に満足の行く結果をもたらすことを見出している。
【0031】
図5は、ステップS401においてスキャンされ得る文書例を示す図である。文書210は、タイトル211、水平のライン212、テイスト領域214、画像領域215、線画領域216及び表217を含んでいる。ブロックセレクション処理は、他の多くのタイプとともに、これらの分離されたオブジェクト領域の各タイプを特定する。
【0032】
ステップS402において、ブロックセレクション処理は、スキャンされた文書内に配置されたオブジェクトの属性及びテキストのフォントサイズを検出する。一般的なブロックセレクション技術(或いはページ分割(page segmentation)技術)がステップS402に用いられ得る。また、上記においてリストアップし、本願に参照として組み込まれている特許出願において記載されているような技術も含まれる。
【0033】
一般に、ブロックセレクション処理は画像内のオブジェクトを特定し、その特定されたオブジェクトに対して、ピクチャ、テキスト、タイトル、表、線画等のような属性を割り当てる。上記のリストに上げた出願に記載されているように、他の多くのタイプの属性が特定されたオブジェクトに割り当てられてもよい。また、オブジェクトの特定において、本発明に従って用いられるブロックセレクション処理技術は、テキストオブジェクト内の個々のテキスト文字のサイズを検出する。
【0034】
本発明において使用可能なブロックセレクション技術の一つの例として、米国特許第5,680,479号に記載されているものがあげられる。この技術を用いて、画像内において特定されたオブジェクトは、サイズ情報とともに、オブジェクトのタイプ(たとえばテキスト、ピクチャ、表等)を特定する属性が割り当てられる。図13は、この技術に従ったブロックセレクションを実行する処理ステップのフローチャートである。図13の各処理ステップは、ハードウエアで実現されても、ソフトウエア或いはハードウエアとソフトウエアのコンビネーションによって実現されてもよい。
【0035】
ここで記述される処理ステップがソフトウエアによって実現される場合には、読み出し専用メモリ(ROM)に格納されたコンピュータプログラムに従って中央処理装置(CPU)がこれらを実行することになる。読み書き可能なメモリ(RAM)が、入力画像データ、処理画像データ、画像の構造に関する情報等を格納するのに用いられ得る。CPUは、ROM、RAM及び入出力デバイス(たとえば、ディスクメモリ、プリンタ/ディスプレイ、スキャナ等)に、バスを介して接続されている。
【0036】
簡潔に述べれば、接続されたコンポーネント(以下、接続コンポーネント)を検出し、その接続コンポーネントをそれらのサイズ、及び他の接続コンポーネントとの相対的な位置に従って分類するべく、画像が解析される。接続コンポーネントは、白画素によって完全に囲まれた黒画素ブロックのグループである。従って、接続コンポーネントとは、少なくとも一つの白画素によって他の黒画素グループから完全に分離されているグループである。はじめに、各接続コンポーネントは、テキストユニットか非テキストユニットに分類される。接続コンポーネントの組織的データを提供するために、階層ツリー構造が形成される。
【0037】
ステップS1301において、画素画像データ中の接続コンポーネントは、輪郭追跡によって検出される。輪郭追跡は、図14Aにおいて示されるように画像データを走査することによって進められる。走査は、画像の右下部分から左へと矢印Aによって示されるように進められ、画像の右側境界に遭遇すると、上方へと進む。走査は、他の方向に進むようにしてもよい。たとえば、左上から右下へと進んでもよい。黒画素に遭遇したとき、隣接する画素について、その黒画素に隣接する画素もまた黒であるかどうかが、31に示される星型状のパターンの順で調べられる。星型バースト状パターン31が共通の中心から放射状に伸びる8個のベクトルを含むので、この輪郭追跡を、以降、「8方向」追跡と称する。隣接した黒画素が見つかった場合は、画像の外輪郭が追跡され終わるまで、上述したように処理が続けられる。こうして、図14Bに示されるように、矢印Aの方向における走査は文字「Q」の尻尾部分に対応するポイント32を見つける。文字「Q」の外輪郭が追跡されるように、隣接画素の検査が星型バースト状パターン31に従って進む。なお、閉じた輪郭の内側部分は追跡されない。
【0038】
一つの接続コンポーネントが検出され、8方向追跡によってその輪郭が追跡された後、走査は次の黒画素が見つかるまで進められる。同様にして、手書きの単語「非テキスト(non-text)」である非テキストオブジェクト35が追跡される。その追跡は、単語「テキスト(text)」を形成する各文字であるテキストオブジェクト36中の個々の文字と同様である。図14Aに示される走査は、画素データ中のすべての接続コンポーネントが検出され、8方向追跡によってそれらの輪郭が検出されるまで続けられる。
【0039】
処理は、ステップS1302に進み、各接続コンポーネントが矩形化される。特に、可能な限り最小の外接矩形が、各接続コンポーネントの周りに描画される。こうして、図14Bに示されるように、矩形37がオブジェクト32の周りに描画され、矩形39はオブジェクト34の周りに描画され、矩形40はオブジェクト35の周りに描画され、そして、矩形41a、41b、41c及び41dがテキストオブジェクト36a、36b、36c及び36dの周りにそれぞれ描画される。
【0040】
ステップS1303において、ツリー上の位置が各矩形ユニットに対して割り当てられる。大部分に関して、ステップS1303で取得されたツリー構造においては、画素画像における各オブジェクトに関して、ツリーのルートから直接に進んでくる。これは、接続コンポーネントの外輪郭のみが追跡され、閉じた輪郭の内側部分は追跡されないからである。
【0041】
こうして図14Cに示されるように、接続コンポーネント32に対応する矩形37はそのページのルートから直接に出てくる。しかしながら、非テキストオブジェクト35に対応する矩形40、テキストオブジェクト36a及び36bに対応する矩形36a及び36bのような、その矩形が完全に別の接続コンポーネント内に存在してしまう接続コンポーネントに関して、それらの接続コンポーネントは、それを囲む接続コンポーネント(この場合、コンポーネント34)からの子孫として示されている。加えて、少なくとも一つの子孫を持つ各接続コンポーネントは、たとえばコンポーネント34であるが、そのコンポーネント自身は、それ自身からの「主要な子孫」として示される。
【0042】
こうして、図14Cにおいて示されるように、コンポーネント39は、コンポーネント39の他の子孫40、41a及び41bの中の主要な子孫として含まれる。ステップS1304において、ツリーの第1レベルの接続コンポーネントの各々は、テキストユニットか或いは非テキストユニットのいずれかに分類される。この分類は2つのステップを経てなされる。まず第1のステップにおいて、接続コンポーネントに対する矩形が所定のサイズ閾値と比較される。その接続コンポーネントを囲む矩形の高さが、予期される最大のフォントサイズに対応する第1の所定の閾値よりも大きい場合、或いは、その接続された輪郭を囲む矩形の幅が、ページを経験的に決定された定数(「5」が満足のいく結果をもたらすことが見出されている)によって分割して得られる幅よりも広い場合、その接続コンポーネントは非テキストユニットとして分類され、当該ユニットに非テキスト属性が付与される。
【0043】
第2のステップにおいて、すべての残りのユニット、すなわち、まだ非テキストとして分類されていないユニットが、すべての残りの接続コンポーネントについて集めたサイズに基づいて適応的に決定された閾値と比較される。具体的には、非テキストユニットとして決定されていないすべての矩形の高さが平均される。この平均高さは、スカラー量(好適には「2」が選択される)によって乗算され、適応的に決定された閾値が得られる。そして、この適応的に決定された閾値よりも大きいすべてのユニットが、非テキストであると推定される。従って、他方の、当該適応的に決定された閾値よりも小さいすべてのユニットはテキストであると推定される。このようにしてユニットは分類され、適当な属性が付与される。そして、これらの分類の両方が、図13の残りの部分において示され、以下においてより完全に説明されるような精錬処理を受ける。
【0044】
ツリー構造の第1のレベルにおける各ユニットがテキスト或いは非テキストに分類された後、テキストユニットの全ての子孫(主要な子孫を含めて)が、まずテキストユニットに分類される。また、非テキストユニットにおいてその主要な子孫の分類は非テキストとして維持されるが、非テキストユニットのすべての他の子孫はテキストユニットに分類される。
【0045】
ステップS1305において、第1ユニットが選択される。ステップS1306において、そのユニットがテキストユニットであった場合、フローはステップS1307へ進み、次のユニットが選択される。フローにおいて、ステップS1306及びS1307が、非テキストユニットが選択されるまで続行される。非テキストユニットが選択されると処理はステップS1308へ進む。
【0046】
ステップS1308において、その非テキストユニットが検査され、当該ユニットからの子孫があるかどうかが判断される。たとえば、図14Cに示されるように、非テキストユニット39は非テキストの主要な子孫39と、テキスト子孫40、41a及び41bを含む。ステップS1308において子孫が存在した場合は、フローはステップS1309へ進む。ステップS1309において、ユニットはフィルター処理され、そのユニットがハーフトーン(或いはグレースケール)であるかどうかが判断される。ハーフトーンフィルタリングにおいて、ユニットの子孫が検査され、「ノイズ」サイズよりも小さいサイズを有する子孫の数が判断される。「ノイズサイズ」のユニットは、その高さが、画像データとして期待される最小のフォントサイズよりも小さいものである。ノイズサイズよりも小さいサイズの子孫の数が子孫の全数の半分よりも大きい場合は、そのユニットはハーフトーンイメージであると判定される。従って、ステップS1310において、フローはステップS1311に進み、「ハーフトーン」属性がそのユニットに付与される。その後、ステップS1312では、そのハーフトーンイメージ中に組み込まれたあらゆるテキストがチェックされる。具体的には、ハーフトーンイメージのテキストサイズの子孫の各々のツリー構造は、そのテキストサイズのユニットがもはやハーフトーンイメージからの子孫ではなく、ハーフトーンイメージと同じレベルであるように、変更される。これは、そのようなものが適切であると思われるならば、ハーフトーンイメージにおけるテキストサイズのユニットの文字認識を可能とする。その後、フローはステップS1307に戻り、次のユニットが処理のために選択される。
【0047】
ステップS1309において、ハーフトーンフィルタリングが、そのユニットはハーフトーンイメージでないと判断した場合、フローはステップS1310を経てステップS1313に進む。ステップS1313において、そのユニットの主要な子孫が更なる処理のために選択される。そして、フローはステップS1314に進む。
【0048】
ステップS1308において非テキストユニットが子孫を持っていないと判断された場合、或いはステップS1313において主要な子孫が更なる処理のために選択された場合は、ステップS1314において、注目されているユニットがフレームフィルタリングに供される。フレームフィルタリングは、注目されているユニットがフレームであり、そのユニットに外接する矩形とほぼ同じ幅及び/または高さを有する平行な水平ライン及び平行な垂直ラインが検出されたかどうかを判断する。特に、接続コンポーネントは、画素単位の各行に対して、ユニット内の接続コンポーネントの内側部分にまたがる最長の距離を計測するために検査される。例えば、図15Aに示されるように、非テキストユニット42は接続コンポーネント43を含む。ここでその接続コンポーネントの輪郭は、44で示されるような8方向追跡によって追跡されたものである。行「i」に対して、接続コンポーネントの内部をつなぐ最長の距離は距離Xiであり、これは輪郭の最も左の境界45aから最も右の境界45bまでの距離である。一方、行「j」に関しては、接続コンポーネントの内部をつなぐ2つの距離が存在する。接続コンポーネントの境界上のポイント46aと46bの間の距離と、ポイント47a及び47bの間の距離である。ここでは、ポイント46aと46bの間の距離が、ポイント47aと47bの間の距離よりも長いので、距離Xjが行「j」に対する接続コンポーネントの内部をつなぐ最長の距離となる。
【0049】
非テキストユニット42におけるn個の行の各々に対して、“x”なる距離が派生し、以下の不等式が、その非テキストユニットがフレームかどうかを判断するために試される。
【0050】
【数1】
【0051】
ここで、Xkは、k番目の行(上述したように)における接続コンポーネントの内部をつなぐ最長距離であり、Wは矩形ユニット42の幅であり、Nは行の数である。また、閾値thresholdは、前もって計算されたものであり、イメージデータにおいてフレームが傾斜したりゆがんだりしていても、フレームの検出を可能とするような値となっている。1度の斜行或いは傾斜角度を許容するために、sin(1度)×L+オフセット(オフセットはステップS1304で計算された平均のテキスト高さに等しい)で求められた閾値が満足の行く結果をもたらすことが見出されている。
【0052】
上記の不等式が満足された場合、そのユニットはフレームデータに決定され、フローはステップS1315を経てステップS1316へ進む。ステップS1316において、「フレーム」属性がそのユニットに付与される。なお、この点において、複数の属性が各ユニットに付与されうる。こうして、たとえば、フレームが「フレームテーブル」或いは「フレームハーフトーン」等として指示されることが可能となる。
【0053】
ステップS1316の後、フローは、フレームデータが表或いはテーブル形式で形成されたデータを含む可能性を考慮するために進む。こうして、ステップS1317において、接続コンポーネントの内部は白輪郭を取得するために調査される。
【0054】
白輪郭は、上述のステップS1301において検出される輪郭に類似するが、ここでは黒画素ではなく白画素が調査される。こうして、図16Aに示されるように、非テキストユニットの内部は、否テキストユニットの内部の右手底部位置から、非テキストユニットの内部の左手上部分への矢印Bの方向に走査される。第1の白画素に遭遇した場合、白画素に隣接する画素が、星型状の方向パターン51に示される順番で調査される。なお、星型状パターン51は、1から4に番号付けされたベクトルを含む。従って、このステップにおける白輪郭追跡は、以降、「4−方向」白輪郭追跡と称する。白輪郭追跡は、黒画素によって囲まれた全ての白輪郭が追跡されるまで4方向にて継続される。たとえば、黒画素セググメント52,53,54及び55の内部輪郭を形成する画素を追跡する。また、同様に、白輪郭追跡は、それらセグメントの内部の、56で全体が示される黒画素のような、他のあらゆる黒画素を追跡する。各白輪郭が見つけられた後、上述のように、非テキストオブジェクト内に囲まれた全ての白輪郭が追跡されるまで、走査は矢印Bの方向に進む。
【0055】
ステップS1318において、非テキストユニットの密度が計算される。密度は、接続コンポーネント内の黒画素の数を計数し、黒画素の総数をその矩形によって囲まれた画素の総数で除することにより計算される。
【0056】
ステップS1319において、非テキストユニット内に見出された白輪郭の数が調査される。白輪郭の数が4以上であった場合、その非テキストイメージは、実際は表であるか、或いは一連のテキストブロックが表の如く整列されたものである可能性がある。従って、ステップS1320では、白輪郭の充填率が判断される。白輪郭の充填率は非テキストイメージによって囲まれた領域を白輪郭が満たす度合いである。図16Aに示されるように、白輪郭充填率は、クロスハッチで示されている領域を含む。ここでクロスハッチで示されている領域は、たとえば、57,59のような、完全に空の白スペースである領域や、その領域中に黒画素が配置されている60,61のような白スペースの領域を含む。充填率が高い場合、その非テキスト領域はテーブル或いは表として配列されたテキストデータ列である可能性がある。従って、ステップS1321において、充填率が調査される。充填率が高い場合、その非テキストイメージはテーブルか一連のテキストデータが整列した表である可能性がある。この決定における信頼性を向上するために、白輪郭は、水平及び垂直方向に伸びるグリッド状の構造を形成するかどうかを判断するために調査される。具体的には、ステップS1322において、非グリッド形態の白輪郭が、それらの境界が水平及び垂直方向に少なくとも2つの輪郭に到達しない場合は、再結合される。たとえば、図16Aに示されるように、白輪郭59の左側境界62と右側境界63は、白輪郭60の左境界64と右境界65に一致するように垂直方向に伸びる。従って、これら白輪郭がグリッド構造に構成されるので、これら白輪郭は再結合されない。同様に、白輪郭63の上側境界66と下側境界67は、白輪郭70の上側境界68と下側境界69に一致するように水平方向に延びる。従って、これら白輪郭はグリッド状の構造をもつので、これら白輪郭は再結合されない。
【0057】
図16B〜図16Dは白輪郭が再結合される状況を説明する図である。図16Bは、非テキストユニット71を示す。これは、たとえば、ステップS201に関して上述したように、ハーフトーンイメージに閾値処理を施してバイナリイメージに形成したものである。非テキストイメージ71は、白領域74,75,76,77,78及び79と、黒領域72を含む。これら白領域の充填率は十分に高いと想定され、ステップS1321においてフローを再結合ステップ1322に進めることになる。まず最初に、図16Cに示されるように、白輪郭75の上側及び下側境界が、白輪郭77の上側及び下側境界と比較される。これらの上側及び下側境界は一致しないので、図16Cに示されるように、白輪郭75は白輪郭76と結合され、結合された白輪郭76’を生成する。
【0058】
図16Dにおいて、白輪郭77の左右の境界は、白輪郭78の左右の境界と比較される。これらの境界は同じではないので、白輪郭77と79は再結合されて一つの白輪郭77’となる。
【0059】
処理は水平及び垂直方向に、それ以上の再結合が生じなくなるまで繰り返される。
【0060】
こうして、上述したように、たとえばハーフトーンイメージ或いは線画のような非テキストに対する白輪郭がより再結合しやすいのに対して、表に対する白輪郭は再結合されにくい。従って、ステップS1323において、再結合率が調査される。この再結合率が高い場合、或いは再結合後に残る白輪郭の数が4未満である場合、フローはステップS1328に進み、更に詳細に後述するように、当該非テキストユニットがハーフトーンイメージ或いは線画として指定されることになる。
【0061】
ステップS1323において、再結合率が高く、少なくとも4つの白輪郭が残った場合、フローはステップS1324へ進み、非テキストイメージが“表”として指定される。ステップS1325において、新たに指定された表の内部が調査され、接続コンポーネントを8方向で検出し、分類する。ステップS1326において、新しい、内部の接続コンポーネントに従って、階層構造が更新される。ステップS1327において、内部の接続コンポーネントがテキスト或いは非テキストに再分類され、ステップS1302からステップS1304に関連して上述したようにして、適切な属性が付与される。その後、フローはステップS1307に戻り、次のユニットが選択される。
【0062】
ステップS1321とS1323に戻り、ステップS1321において充填率が高くない場合、或いはステップS1323において再結合率が高い場合は、非テキストのフレーム化されたユニットは、ハーフトーンイメージか線画のいずれかである可能性が高い。ユニットがハーフトーンイメージとして分類されるか線画として分類されるかは、当該ユニット内の黒画素の水平方向の平均ランレングス、当該ユニット内の白画素の水平方向の平均ランレングス、黒画素と白画素の比率、密度に基づいて決定される。概して、非常に暗い画像はハーフトーンイメージとみなされ、白い明るいイメージは線画とみなされる。
【0063】
特に、白画素の平均ランレングスがほぼゼロに等しい(すなわち、暗い部分或いは斑点が支配的な画像)場合、そして、ステップS1318で計算された密度がそのユニットが白よりもより黒の傾向であることを示す場合(すなわち、約1/2と等しい第1の閾値よりも大きい場合)、フレーム化されたユニットはハーフトーンであると決定される。また、密度が第1の閾値よりも大きくない場合、そのユニットは線画と判定される。
【0064】
白画素の平均ランレングスが、おおよそゼロとはならず、白画素の平均ランレングスが黒画素の平均ランレングスよりも大きい場合、そのフレーム化されたユニットは線画であると判断される。しかし、白画素の平均ランレングスが黒画素の平均ランレングスよりも大きくない場合(すなわち、周期的な暗い画像)には、更なるテストが必要となる。
【0065】
具体的には、黒画素の数が白画素の数よりも非常に少ない(すなわち、白画素の数で割られる黒画素の数が、およそ2である第2の閾値よりも大きい)場合、そのフレーム化されたユニットはハーフトーンユニットであると判断される。一方、黒画素の数を白画素の数で割った値が第2の閾値よりも大きくないが、ステップS1318で決定された密度が第1の閾値よりも大きい場合、そのフレーム化されたユニットはハーフトーンイメージであると判断される。そうでない場合には、フレーム化されたユニットは線画であると判断される。
【0066】
従って、ステップS1328において、フレーム化されたユニットが線画であると判断されると、フローはステップS1329へ進む。ステップS1329では、「線画」の属性が付与され、そこからステップS1330へ進み、全ての子孫(派生)が取り除かれる。詳細にいえば、ユニットが線画であると判断されると、その線画のユニットから選択される、文字認識が可能なブロックはない。その後、フローはステップS1307へ戻り、次のユニットが選択される。
【0067】
一方、ステップS1328において、フレーム化されたユニットが線画ではないと判断された場合、フローはステップS1331に進む。ステップS1331では、「ハーフトーン」の属性が付与され、そこからステップS1332へ進み、そのフレーム化されたハーフトーンユニットのテキストサイズの子孫が除去される。テキストサイズはステップS1304において上述したように、平均のユニット高さに従って決定される。テキストサイズの子孫よりも大きな全ての子孫は、そのフレーム化されたハーフトーンユニットからの子孫として残ることが許される。フローはステップS1307に戻り、次のブロックが選択される。
【0068】
ステップS1319に戻って、白領域の数が4よりも大きくない場合、そのフレーム化されたユニットは表とはみなされない。従って、フローはステップS1333へ進み、ステップS1318で計算された密度が、およそ0.5に等しい閾値と比較される。閾値は、フレーム内のテキストユニット或いは線画は、画素の半分未満しか占有しないという予測に基づいて選択される。密度が閾値よりも小さい場合、フローはステップS1334へ進む。ステップS1334において、フレーム化されたユニットの内部構造が、上述したように構成される。すなわち、フローは、フレーム化されたユニットの内部構造のためにステップS1301に戻る。
【0069】
ステップS1333において、密度が所定の閾値よりも小さい場合、そのフレーム化されたユニットが線画とハーフトーンイメージのいずれに分類され得るか、或いはフレームが分類不能である(すなわち、そのフレームは「未知」となる)かについての判断をするために、フローはステップS1343に進む。
【0070】
ステップS1315に戻り、ステップS1314におけるフレームフィルタリングが、非テキストユニット内のフレームを検出しない場合、フローはステップS1335へ進み、その非テキストユニットがラインを含んでいるかどうかを判断する。ラインは、テキスト境界を図示するのに有用な非テキストユニットである。しかし、そのようなラインによって仕切られるテキストは、しばしばそのラインの近傍に現れるので、そのテキストがラインに付着してしまう可能性がある。従って、ライン検出は、テキストの付属を有するラインと有しないラインの両方を検出するように設計される。
【0071】
付属物のないラインを検出するために、非テキストユニットのヒストグラムが、そのユニットの縦の方向において計算される。図15Bに示されるように、ラインのヒストグラム48は、ある程度均一な分布を示し、その高さはそのラインの幅とほぼ等しい。また、ラインの幅は非テキストユニットの幅(W)とほぼ等しくなる。ここで生じるあらゆる違いは、傾斜角度θαによるものである。それは、画素イメージが形成されるときに原稿が斜行している場合に、結果として生じるものである。従って、その非テキストユニットがラインを含むかどうかを判断するために、ヒストグラムにおける各セルcellkの高さ49が非テキストユニットの幅Wと比較される。以下のように、これらの値の二乗平均差が閾値と比較される。
【0072】
【数2】
【0073】
閾値は、非テキストユニット内のラインの斜行或いは傾斜θαを許容するために計算されたものである。1度の斜行或いは傾斜に対して、閾値を以下の式で求めることで、満足の行く結果が得られることが見出されている。
【0074】
【数3】
【0075】
付属物のないラインが上記の不等式によって見つからなかった場合は、そのユニットが付属物を有するラインを含むかどうかについての決定がなされる。付属物を有するラインが非テキストユニットに含まれるかどうかを判断するために、ラインがテキストユニットの境界に沿って長手方向に延びているかどうかについてそのテキストユニットが調べられる。具体的には、そのユニットをとおして長手方向にラインが延びる場合は、図15Cに示されるように、そのユニットに外接する矩形の境界はラインに非常に近接して存在する。従って、その矩形の境界内に存在する黒画素の均一さが、その境界からの距離の二乗の和を計算することで調べられる。こうして、図15Cを参照すると、以下の不等式が試される。
【0076】
【数4】
【0077】
もしも二乗の和が所定の閾値よりも小さい場合は、付属物のついたラインが見いだされる。上記の付属物のないラインに関して与えられたのと同じ閾値が、満足の行く結果をもたらすことが見出されている。
【0078】
ステップS1335において、ラインが検出されると、フローはステップS1336を経てステップS1337へ進む。ステップS1337において、「ライン」の属性がその非テキストユニットに付与される。そして、フローは、ステップS1337へ進み、次のユニットが選択される。
【0079】
一方、ステップS1335においてラインが検出されなかった場合、フローはステップS1336を経てステップS1338へ進む。ステップS1338では、その非テキストユニットのサイズが検査される。そのサイズが所定の閾値よりも大きくない場合、その非テキストユニットの分類は決定されない。なお、この閾値は、最大のフォントサイズに依存して設定され、最大フォントサイズの半分を用いると満足の行く結果が得られる。従って、フローはステップS1339に進み、「未知」の属性がその非テキストユニットに付与される。その後、フローはステップS1307に戻り、次のユニットが選択される。
【0080】
ステップS1338において、サイズが所定の閾値よりも大きい場合、フローはステップS1340,S1341及びS1342に進む。ステップS1340では、その非テキストユニットの内部白輪郭が追跡され、ステップS1341では、その非テキストユニットの密度が計算され、そしてステップS1342では、ステップS1317,S1318及びS1319に関して上述したように、白輪郭の数が調査される。
【0081】
ステップS1342において、白輪郭の数が4未満の場合、フローはステップS1343に進む。ステップS1343では、そのユニットのサイズが計算され、そのユニットが線画或いはハーフトーンイメージを構成するのに十分な大きさを有するかどうかを決定する。このサイズ決定は、黒画素の最大ランレングスとともに、その非テキストユニットの高さ及び幅に基づいてなされる。具体的には、その非テキストユニットの高さ及び幅が最大フォントサイズよりも大きくない場合、その非テキストユニットは、ハーフトーンイメージ或いは線画と判定するには十分な大きさではない。そして、フローはステップS1344に進み、「未知」の属性が付与される。同様に、その非テキストユニットの幅が最大フォントサイズよりも大きいが、黒画素の最大ランレングスが最大フォントサイズよりも大きくない場合も、フローはステップS1344に進み、「不明」の属性が与えられる。フローはその後、ステップS1307に戻り、新しいユニットが選択される。
【0082】
ステップS1343においてその非テキストユニットが線画或いはハーフトーンイメージのいずれかであるのに十分な大きさを有する場合、フローはステップS1345に進み、その非テキストユニットが線画であるかハーフトーンイメージであるかを決定する。ステップS1345からステップS1349は、ステップS1328からステップS1332とそれぞれ同様のものであり、それらの説明は省略する。
【0083】
図4に戻り、ステップS404において、ドキュメントが高解像度でスキャンされる。その結果として得られた高解像度画素データが出力イメージを生成するのに用いられるので、高解像度データであることが低解像度データよりも望ましい。本発明の他の態様において、ステップS401でドキュメントが高解像度でスキャンされ、ステップS402において後続のブロックセレクション処理のために低解像度に変換されるようにしてもよい。ステップS401で高解像度スキャンを行なうこの他の態様においては、ステップS404は実行されないことになる。
【0084】
高解像度画素データがステップS404で取得された後、そのデータは、エッジ検出器115及び色度判定ユニット116を用いるとともに、検出されたオブジェクト属性やフォントサイズを用いて処理される。
【0085】
図3に示されるように、R4,G4及びB4の信号は、入力マスキングユニット106においてマスキング変換されており、黒文字判定ユニット113のエッジ検出器115に入力される。図6は、エッジ検出器の内部構成を示すブロック図である。最初に、輝度信号Yが、輝度計算回路250により、R4,G4及びB4に基づいて計算される。図7は、回路250の詳細な回路構成を示す図である。
【0086】
図7において、入力されたカラー信号R,G,Bのそれぞれには、乗算器301,302,303によって、係数0.25,0.50,0.25が乗算される。そして、取得された値は加算器304,305において加算される。従って、輝度信号Yは、
Y=0.25R+0.5G+0.25B
なる等式を用いて計算されることになる。
【0087】
輝度信号Yを計算した後、図6のエッジ最小方向検出器251はその信号を3つのラインに展開する。図8は、検出器251のFIFO401,402を示す。FIFO401,402の各々は1ライン分の遅延をもたらす。これら3つのラインは、周知のラプラシアンフィルタ403〜406によってフィルタされる。そして、図8に示されるように、検出器251は、フィルタから出力されるエッジコンポーネントの量の絶対値が最小となる方向を決定する。決定された方向はエッジ方向として指定される。
【0088】
次に、エッジ最小方向スムージングユニット252において、スムージング処理が、輝度信号Yに対して、エッジ最小方向について適用される。スムージング処理を適用することにより、そのエッジコンポーネントを、そのエッジコンポーネントが最大である方向に維持することが可能となり、そのエッジコンポーネントを他の方向に平滑化(スムージング)することができる。
【0089】
換言すれば、1つの方向のみにエッジコンポーネントを有する文字/ラインについては、その特性が維持される一方で、複数の方向に大きなエッジコンポーネントを有するドットコンポーネントに対して、エッジコンポーネントがエッジ検出器115によって平滑化される。なお、この処理を必要な回数だけ繰り返すことにより、ラインコンポーネントはドットコンポーネントからより効果的に分離される。これにより、スクリーンドットに含まれる文字コンポーネントを検出することが可能となる。
【0090】
入力信号は、エッジ検出器253において上述のラプラシアンフィルタによってフィルタされ、エッジ量の絶対値が値a以下である信号を排除する。結果として、エッジ量の絶対値が値aよりも大きい信号が、論理「1’s」として出力される。図9A、9Bは、エッジ検出の例を示す図である。ここで、図9Aにおける輝度データYのイメージデータは図9Bにおいて示されるエッジ検出信号として出力される。
【0091】
エッジ検出器115は、5つのコードのうちのいずれかを表す3ビットの「エッジ(edge)」信号を出力する。そのコードは、エッジが、注目画素の周りの7×7のブロックサイズのマスク、5×5のブロックサイズのマスク或いは3×3のブロックサイズのマスクを用いて注目画素の周りで見出された、マスクなしで注目画素の周りに見出された、或いはエッジがその注目画素の周りには見つからなかったことを表す。換言すれば、「エッジ」信号は、合計で5種類の情報を含む3ビットコードであり、その情報はすなわち、エッジ画素として検出される画素が、注目画素の周囲の7×7画素ブロック内に存在する、5×5画素ブロック内に存在する、3×3画素ブロック内に存在する、注目画素を含む全てのブロックに存在する、そして注目画素がエッジ画素と判断されるか否かに関するものである。
【0092】
図10は、色度決定回路116の構成を示すブロック図である。最大値検出器601と最小値検出器602において、最大値であるmax(R,G,B)と最小値であるmin(R,G,B)がそれぞれ入力されたカラー信号R4,G4,B4から抽出される。そして、その差分、ΔC=max(R,G,B)−min(R,G,B)が減算器603によって計算される。次に、LUT604において、図11に示した特性に従ったデータ変換が遂行され、色度信号Crが生成される。
【0093】
図11では、色度が低くなる(非色度に近づく)に従って、ΔCの値がゼロに近づき、一方、色度が高くなるに従って、ΔCの値が増加することが示されている。言い換えれば、色の非色度が大きくなるに従ってCrは大きな値を有し、色度が大きくなるに従ってCrはゼロに近づく。なお、図3において色度決定回路116から出力される信号“col”は、“color”、“black”、“gray”(“color”と“black”の中間のカラーを表す)、或いは“white”を2ビットコードを用いて表したものである。
【0094】
LUT205はフォントサイズと属性信号をブロックセレクションユニット200から受けとり、エッジ信号をエッジ検出器115から受け取り、col信号を色度決定回路116から受け取る。LUT205は、これらを受けて、UCR、FILTER、SENを出力する。これらが有する値は、本願明細書の発明の背景の項で説明したとおりである。しかしながら、本発明によれば、UCR、FILTER、SENの信号は、LUT205と、上述のフォントサイズ(font size)、属性(attribute)、エッジ(edge)及びcol信号の内容に基づいたものである。
【0095】
図12はLUT205の内容を説明する図である。図示のように、LUT205は、col、属性(attribute)、フォントサイズ(font size))及びエッジ(edge)の各信号に基づいて、対応するUCR,FILTER及びSENの値を割り当てる。こうして、ブロックセレクションユニット200から出力された信号により、LUT205の内容は、注目画素データにより適切な処理を提供するために特定され得る。たとえば、図1の文字太さ判定回路114では、注目画素が存在する領域のタイプを表わすことを意図する出力信号を生成する。本実施形態では、ブロックセレクションユニット200を用いて、その領域内のテキストサイズと共に、領域のより正確な判定が得られる。従って、より正確な処理がその領域について遂行され得る。
【0096】
LUT205の値を用いた処理の1つの例は、テキスト画素及びエッジ画素であると判定された注目画素に対してシャープ化処理(FILTER=1)を実行すること、注目画素がテキスト画素であるともエッジ画素であるとも判定されなかった場合にその注目画素に平滑化(スムージング)処理(FILTER=3)を実行することである。加えて、テキスト画素であってエッジ画素ではないと判定された画素に対して、その画素はテキスト文字の内部の領域の一部であると仮定され、従って、その画素に対して内部平滑化処理(FILTER=0)が実行される。他の例において、非テキスト領域内の画素に対しては、全体的に平滑化処理(FILTER=3)が実行される。もちろん、平滑化処理の他の組み合わせ、下色除去及び選択された印刷解像度が、本発明に従って、採用され得る。それらの多くは、図12において示される値によって図解されている。
【0097】
以上、本発明について、現在のところその望ましい実施形態と考えられるものについて説明したが、本発明が上述したものに限定されないことはいうまでもない。反対に、本発明は、添付のクレームの精神と範囲の中に含まれる種々の改良や等価な構成をカバーするべく意図するものである。
【図面の簡単な説明】
【図1】一般的な画像処理ユニット内における画像信号の流れを示すブロック図である。
【図2】本発明の実施形態に係るカラー複写機の断面図である。
【図3】本発明に係る画像信号のフローを示すブロック図である。
【図4】本発明に従って画像データを処理するための処理ステップを示すフローチャートである。
【図5】本発明に従った処理のための画素データを含むドキュメントを示す図である。
【図6】エッジ検出回路の内部構成を説明するブロック図である。
【図7】輝度計算回路の詳細な構成を示す図である。
【図8】FIFOによるライン遅延と、ラプラシアンフィルタを示す図である。
【図9A】エッジ検出の例を示す図である。
【図9B】エッジ検出の例を示す図である。
【図10】色度半て回路を示すブロック図である。
【図11】ルックアップテーブルにおけるデータ変換の特性を説明する図である。
【図12A】本発明に係るルックアップテーブルの内容を説明する図である。
【図12B】本発明に係るルックアップテーブルの内容を説明する図である。
【図12C】本発明に係るルックアップテーブルの内容を説明する図である。
【図12D】本発明に係るルックアップテーブルの内容を説明する図である。
【図12E】本発明に係るルックアップテーブルの内容を説明する図である。
【図12F】本発明に係るルックアップテーブルの内容を説明する図である。
【図12G】本発明に係るルックアップテーブルの内容を説明する図である。
【図13A】画素画像データ中の接続コンポーネントがどのようにして分類されるかを説明するフローチャートである。
【図13B】画素画像データ中の接続コンポーネントがどのようにして分類されるかを説明するフローチャートである。
【図13C】画素画像データ中の接続コンポーネントがどのようにして分類されるかを説明するフローチャートである。
【図14A】輪郭追跡を説明する図である。
【図14B】輪郭追跡を説明する図である。
【図14C】輪郭追跡を説明する図である。
【図15A】非テキストユニットに対する分類処理を説明する図である。
【図15B】非テキストユニットに対する分類処理を説明する図である。
【図15C】非テキストユニットに対する分類処理を説明する図である。
【図16】白輪郭処理を説明する図である。
Claims (7)
- 画像処理装置による画像処理方法であって、
第1の解像度でドキュメントをスキャンして、低解像度の画像データを得る第1入力工程と、
前記低解像度の画像データを解析して、前記ドキュメントに含まれるオブジェクトを検出し、該オブジェクトのサイズに基づいて該オブジェクトの属性がテキスト属性であるか否かを識別し、該オブジェクトの属性がテキスト属性である場合は該オブジェクトにおけるテキストのフォントサイズを識別する識別工程と、
前記ドキュメントを前記第1の解像度よりも高い第2の解像度でスキャンして、高解像度の画像データを得る第2入力工程と、
前記高解像度の画像データからエッジを検出するエッジ検出工程と、
前記高解像度の画像データから各画素の色度を検出する色度検出工程と、
前記識別工程で識別された属性とフォントサイズ、前記エッジ検出工程で検出されたエッジ、及び前記色度検出工程で検出された色度に基づいて黒生成処理および空間フィルタ処理を決定し、決定された黒生成処理および空間フィルタ処理を前記高解像度の画像データに実行する処理工程とを有することを特徴とする画像処理方法。 - 前記識別工程では、輪郭追跡を用いて前記ドキュメントに含まれるオブジェクトを検出することを特徴とする請求項1に記載の画像処理方法。
- 前記識別工程では、
前記輪郭追跡により抽出された領域から矩形領域を設定し、
前記オブジェクトの属性がテキスト属性であるか否かの識別においては、該オブジェクトに対応して設定された矩形領域の高さが、予期される最大のフォントサイズに対応する所定の閾値より大きい場合に該オブジェクトの属性がテキスト属性ではないと識別することを特徴とする請求項2に記載の画像処理方法。 - 前記エッジの検出は、前記高解像度の画像データの各画素について、当該画素を中心とした異なる範囲を参照してエッジを検出して得られた複数の検出結果を多値のデータで表して出力することを特徴とする請求項1乃至3のいずれか1項に記載の画像処理方法。
- 前記識別工程では、更に前記オブジェクトがフレーム属性か否か、ライン属性か否かを識別することを特徴とする請求項1に記載の画像処理方法。
- スキャナを用いて第1の解像度でドキュメントをスキャンして、低解像度の画像データを得る第1入力手段と、
前記低解像度の画像データを解析して、前記ドキュメントに含まれるオブジェクトを検出し、該オブジェクトのサイズに基づいて該オブジェクトの属性がテキスト属性であるか否かを識別し、該オブジェクトの属性がテキスト属性である場合は該オブジェクトにおけるテキストのフォントサイズを識別する識別手段と、
前記スキャナを用いて前記ドキュメントを前記第1の解像度よりも高い第2の解像度でスキャンして、高解像度の画像データを得る第2入力手段と、
前記高解像度の画像データからエッジを検出するエッジ検出手段と、
前記高解像度の画像データから各画素の色度を検出する色度検出手段と、
前記識別手段で識別された属性とフォントサイズ、前記エッジ検出手段で検出されたエッジ、及び前記色度検出手段で検出された色度に基づいて黒生成処理および空間フィルタ処理を決定し、決定された黒生成処理および空間フィルタ処理を前記高解像度の画像データに実行する処理手段とを備えることを特徴とする画像処理装置。 - コンピュータに画像処理を実行させるためのコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体であって、前記コンピュータに、
第1の解像度でドキュメントをスキャンして、低解像度の画像データを得る第1入力工程と、
前記低解像度の画像データを解析して、前記ドキュメントに含まれるオブジェクトを検出し、該オブジェクトのサイズに基づいて該オブジェクトの属性がテキスト属性であるか否かを識別し、該オブジェクトの属性がテキスト属性である場合は該オブジェクトにおけるテキストのフォントサイズを識別する識別工程と、
前記ドキュメントを前記第1の解像度よりも高い第2の解像度でスキャンして、高解像度の画像データを得る第2入力工程と、
前記高解像度の画像データからエッジを検出するエッジ検出工程と、
前記高解像度の画像データから各画素の色度を検出する色度検出工程と、
前記識別工程で識別された属性とフォントサイズ、前記エッジ検出工程で検出されたエッジ、及び前記色度検出工程で検出された色度に基づいて黒生成処理および空間フィルタ処理を決定し、決定された黒生成処理および空間フィルタ処理を前記高解像度の画像データに実行する処理工程とを実行させるコンピュータプログラムを格納したコンピュータ読み取り可能な記憶媒体。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US09/458941 | 1999-12-10 | ||
US09/458,941 US6718059B1 (en) | 1999-12-10 | 1999-12-10 | Block selection-based image processing |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001274990A JP2001274990A (ja) | 2001-10-05 |
JP2001274990A5 JP2001274990A5 (ja) | 2008-01-31 |
JP4405663B2 true JP4405663B2 (ja) | 2010-01-27 |
Family
ID=23822720
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000376263A Expired - Fee Related JP4405663B2 (ja) | 1999-12-10 | 2000-12-11 | 画像処理方法及び装置 |
Country Status (2)
Country | Link |
---|---|
US (1) | US6718059B1 (ja) |
JP (1) | JP4405663B2 (ja) |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4424845B2 (ja) * | 1999-12-20 | 2010-03-03 | 本田 正 | イメージデータ圧縮方法及び復元方法 |
JP4105367B2 (ja) * | 2000-05-11 | 2008-06-25 | 富士フイルム株式会社 | 色変換装置および色変換プログラム記憶媒体 |
JP2004005211A (ja) * | 2002-05-31 | 2004-01-08 | Toshiba Corp | 情報処理装置 |
JP4387907B2 (ja) * | 2003-11-21 | 2009-12-24 | キヤノン株式会社 | 画像処理方法及び装置 |
JP2007188474A (ja) * | 2005-12-12 | 2007-07-26 | Ricoh Co Ltd | ユーザインタフェース装置、項目設定方法およびプログラム |
US7889932B2 (en) * | 2006-03-02 | 2011-02-15 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US7792359B2 (en) | 2006-03-02 | 2010-09-07 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting regions in digital images |
US8630498B2 (en) * | 2006-03-02 | 2014-01-14 | Sharp Laboratories Of America, Inc. | Methods and systems for detecting pictorial regions in digital images |
JP4135752B2 (ja) * | 2006-06-12 | 2008-08-20 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法及び画像処理プログラム |
US8437054B2 (en) * | 2006-06-15 | 2013-05-07 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying regions of substantially uniform color in a digital image |
US7864365B2 (en) * | 2006-06-15 | 2011-01-04 | Sharp Laboratories Of America, Inc. | Methods and systems for segmenting a digital image into regions |
JP4706581B2 (ja) * | 2006-07-14 | 2011-06-22 | 富士ゼロックス株式会社 | 画像処理装置および画像形成装置 |
US7876959B2 (en) * | 2006-09-06 | 2011-01-25 | Sharp Laboratories Of America, Inc. | Methods and systems for identifying text in digital images |
US20090041344A1 (en) * | 2007-08-08 | 2009-02-12 | Richard John Campbell | Methods and Systems for Determining a Background Color in a Digital Image |
US8989493B1 (en) * | 2012-02-06 | 2015-03-24 | Marvell International Ltd. | Method and apparatus for identifying regions of an image to be filtered during processing of the image |
KR20200068457A (ko) | 2018-12-05 | 2020-06-15 | 삼성전자주식회사 | 에지 보전 스무딩을 수행하는 이미지 프로세싱 장치 및 이의 이미지 프로세싱 방법 |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2872285B2 (ja) | 1989-08-02 | 1999-03-17 | キヤノン株式会社 | 画像処理装置及び画像処理方法 |
JPH0722330B2 (ja) | 1990-01-10 | 1995-03-08 | 富士ゼロックス株式会社 | 画像処理装置の画像領域識別方式 |
ATE137377T1 (de) | 1990-02-06 | 1996-05-15 | Canon Kk | Bildverarbeitungsgerät |
US5696842A (en) * | 1991-07-04 | 1997-12-09 | Ricoh Company, Ltd. | Image processing system for adaptive coding of color document images |
US5452374A (en) * | 1992-04-06 | 1995-09-19 | Ricoh Corporation | Skew detection and correction of a document image representation |
US5680479A (en) | 1992-04-24 | 1997-10-21 | Canon Kabushiki Kaisha | Method and apparatus for character recognition |
JPH0750752A (ja) | 1993-08-06 | 1995-02-21 | Fuji Xerox Co Ltd | 画像密度変換方法及び装置 |
JP3599367B2 (ja) | 1993-12-29 | 2004-12-08 | キヤノン株式会社 | 画像処理装置およびその方法 |
US5729360A (en) | 1994-01-14 | 1998-03-17 | Fuji Xerox Co., Ltd. | Color image processing method and system |
US5715377A (en) | 1994-07-21 | 1998-02-03 | Matsushita Electric Industrial Co. Ltd. | Gray level correction apparatus |
TW367447B (en) | 1994-12-21 | 1999-08-21 | Canon Kk | Block selection review and editing system |
JP3343457B2 (ja) * | 1994-12-22 | 2002-11-11 | 京セラミタ株式会社 | 画像処理装置 |
JPH08331398A (ja) | 1995-05-31 | 1996-12-13 | Canon Inc | 画像処理システム及びコントローラ |
US5848186A (en) | 1995-08-11 | 1998-12-08 | Canon Kabushiki Kaisha | Feature extraction system for identifying text within a table image |
US5774579A (en) | 1995-08-11 | 1998-06-30 | Canon Kabushiki Kaisha | Block selection system in which overlapping blocks are decomposed |
US5778092A (en) * | 1996-12-20 | 1998-07-07 | Xerox Corporation | Method and apparatus for compressing color or gray scale documents |
JPH11143986A (ja) * | 1997-10-17 | 1999-05-28 | Internatl Business Mach Corp <Ibm> | ビットマップイメージの処理方法及び処理装置、ビットマップイメージの処理を行うイメージ処理プログラムを格納した記憶媒体 |
-
1999
- 1999-12-10 US US09/458,941 patent/US6718059B1/en not_active Expired - Fee Related
-
2000
- 2000-12-11 JP JP2000376263A patent/JP4405663B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
US6718059B1 (en) | 2004-04-06 |
JP2001274990A (ja) | 2001-10-05 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4405663B2 (ja) | 画像処理方法及び装置 | |
JP3768052B2 (ja) | カラー画像処理方法、カラー画像処理装置、及びそのための記録媒体 | |
US7724950B2 (en) | Image processing apparatus, image processing method, computer program, and storage medium | |
CN102984429B (zh) | 图像处理设备和图像处理方法 | |
US5956468A (en) | Document segmentation system | |
US6504949B2 (en) | Image processing apparatus and method | |
US7340092B2 (en) | Image processing device, image processing method, program for executing image processing, and computer readable recording medium on which the program is stored | |
US6377711B1 (en) | Methods and systems for detecting the edges of objects in raster images using diagonal edge detection | |
US8345310B2 (en) | Halftone frequency determination method and printing apparatus | |
US20090284801A1 (en) | Image processing apparatus and image processing method | |
JP2007193750A (ja) | 画像処理装置、文字判定プログラム、および文字判定方法 | |
JP4115999B2 (ja) | 画像処理装置、画像形成装置、画像読取処理装置、画像処理方法、画像処理プログラムおよびコンピュータ読み取り可能な記録媒体 | |
JPH0435167A (ja) | 線画分離方法および装置 | |
KR101224936B1 (ko) | 화상 처리 장치, 화상 형성 장치, 및 컴퓨터 판독 가능한 매체 | |
JP4140519B2 (ja) | 画像処理装置、プログラムおよび記録媒体 | |
JP2003189096A (ja) | 画像処理装置 | |
US20100322511A1 (en) | Image processing for binarization of image data | |
US6661921B2 (en) | Image process apparatus, image process method and storage medium | |
US8330997B2 (en) | Image processing apparatus, image forming apparatus and image processing method | |
CN107920184B (zh) | 图像处理装置以及图像处理方法 | |
US6947595B2 (en) | System for processing object areas of an image | |
JP2003209704A (ja) | 画像処理方法、画像処理装置、画像形成装置、画像処理プログラムおよび記録媒体 | |
JP3796985B2 (ja) | 画像処理装置、画像処理方法および記憶媒体 | |
JP3830350B2 (ja) | カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体 | |
JPH11136505A (ja) | 画像処理装置およびその方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071211 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20071211 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20071211 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080828 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090303 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090313 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090512 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20091030 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20091105 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121113 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131113 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |