JP3890840B2 - 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 - Google Patents
画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 Download PDFInfo
- Publication number
- JP3890840B2 JP3890840B2 JP36473399A JP36473399A JP3890840B2 JP 3890840 B2 JP3890840 B2 JP 3890840B2 JP 36473399 A JP36473399 A JP 36473399A JP 36473399 A JP36473399 A JP 36473399A JP 3890840 B2 JP3890840 B2 JP 3890840B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- output value
- output
- value
- image processing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Character Input (AREA)
- Image Input (AREA)
- Image Analysis (AREA)
Description
【発明の属する技術分野】
本発明は、文書画像の認識技術に関し、特に、カラーの図形、あるいはグレースケールの図形を含む文書画像から連結成分を抽出し、文字認識の単位となる基本成分を求め、求められた基本成分の特徴から2値化と文字認識すべき基本成分を抽出する技術に関する。
【0002】
カラー文書及びグレースケール文書の、文書全体に占める割合は増加しており、これらの文書の文字を効率的に認識する技術の確立が求められている。
【0003】
文書画像の認識効率の向上のためには、2値化と文字認識を行う画像の単位を適切に抽出することが必要である。従って、画像の単位である基本成分を適切に抽出し、さらに、あらかじめ図形と判定できる基本成分を削除しておくことが重要な課題となる。
【0004】
【従来の技術】
従来のカラー文書認識技術では、
1.同色の画素をクラスタリングする色ラベリング法。
2.カラー画像から画素ごとの明度成分などのグレースケール値を抽出し、グレースケール画像を生成し、そのグレースケール画像のエッジを抽出し、2値化とラベリングを行う方法。
により連結成分を抽出し、この連結成分の外接矩形に含まれるグレースケール画像を基本成分として文字を認識する方法が有力である。
【0005】
特に、低解像度のカラー文書に対しては、後者が有効である。図4は、従来の連結成分の抽出処理フロー例である。以下図6(1)に示すグレースケール画像から連結成分を抽出する処理について説明する。図6(1)のa−a’断面のグレースケール値を図5(2)に示す。
【0006】
1a.図5(1)に示すソーベルフィルタ等の差分フィルタを用い、グレースケール画像からエッジを抽出した、エッジグレー画像を生成する。この結果を図5(3)に示す。この場合、エッジグレー画像のb−b’の部分のグレースケール値は、0になることなく、正から負に変化する。
1b.エッジグレー画像を2値化し、エッジ2値画像を生成する。この結果を図6(2)に示す。
1c.エッジ2値画像をラベリングし、連結成分を求める。
【0007】
【発明が解決しようとする課題】
差分フィルタによるエッジ抽出では、図5(3)に示す如く、グレースケール値が変化する位置、即ち文字、及び図形の境界がエッジとして抽出される。しかし、図6(1)のグレースケール画像における、a−a’断面のb−b’区間のような、文字と図形の間隔が狭い画像のエッジ抽出を行った場合は、図5(3)に示す如く、エッジ同士が接触する。このようなエッジグレー画像を2値化すると、文字と図形の境界部分でもグレースケール値が0近傍にならないため、図6(2)に示すごとく、文字と図形が互いに接触し、文字と図形が連結した基本成分が抽出される。
【0008】
基本成分の文字認識は、抽出された、文字と図形が連結した基本成分について行われるため、文字部分が文字として認識されずに、文字情報から欠落してしまう。文字と図形の連結を回避するためには、図5(3’)に示すごとく、エッジグレー画像の値が、0近傍の、2値化の閾値以下になる部分が必要である。
【0009】
【課題を解決するための手段】
本発明では、上記課題を、以下の手段で解決する。
1.連結成分の抽出に関しては、画像上を走査し、画像のエッジを検出する差分フィルタ手段と、差分フィルタ手段の出力値が負に変化した場合は、この値が負のピークを越えるまで出力値を0とし、差分フィルタ手段の出力値が正に変化した場合は、この値が正のピークを越えてから0になるまで出力値を0とし、それ以外の場合は差分フィルタ手段の出力値を出力する、画像変換手段と、画像変換手段の出力を2値化する、2値化手段と、2値化手段の出力をラベリングする、ラベリング手段とを設ける。
【0010】
画像変換手段の具体的な例では、図2(1)に示す、画素ずれをおこす差分フィルタ手段を有し、次式の演算を行う。
【0011】
【数1】
【0012】
これにより、図2(2)に示すごとく、エッジグレー画像におけるエッジの外側、即ち画像が黒から白に変化する際の外側の広がり部分を検出し、図3(1)に示すごとく、この部分のグレースケール値を0にすることで除去する。
【0013】
なお、エッジグレー画像の生成の際は、従来のエッジグレー画像の生成処理と同様に、差分フィルタ手段、及び画素ずれ差分フィルタ手段を、グレースケール画像上でx、y両方向に走査するものとする。
【0014】
エッジの外側が除去されたエッジグレー画像を2値化とラベリングすることにより、文字と図形の間隔が狭い場合でも、エッジ連結成分同士の接触を回避できる。
【0015】
【発明の実施の形態】
図1は、連結成分を抽出する、本発明の第1の構成例を示す。差分フィルタ手段3aは、例えば図5(1)に示すソーベルフィルタであり、グレースケール画像からエッジを抽出し、エッジグレー画像を生成する。生成されたエッジグレー画像におけるエッジは、図5(3)に示す如く、画像の境界を中心に、境界の両側に対称的に発生する。
【0016】
画像変換手段3cは、差分フィルタの出力値が負に変化した場合は、この値が負のピークを越えるまで出力値を0とし、差分フィルタの出力値が正に変化した場合は、この値が正のピークを越えてから0になるまで出力値を0とし、それ以外の場合は差分フィルタの出力値を出力する。
【0017】
画像変換手段3cは、例えば図2(1)に示す画素ずれ差分フィルタ手段3bを用い、前記の式による変換を行う。画素ずれフィルタ手段3bは、図2(2)に示すごとく、境界から画素ずれしたエッジグレー画像を生成する。この変換により、図3(1)の太線で示す如く、差分フィルタ手段3aで生成されたエッジの外側が除去された出力が得られる。
【0018】
2値化手段3dは、画像変換手段3cで得られたエッジグレー画像を2値化し、エッジ2値画像を生成する。図6(1)のグレースケール画像に、本発明による上記の処理を施し、得られたエッジ2値画像を図3(2)に示す。この図に示すごとく、図6(2)に示す、従来のエッジ2値画像ではb−b’部分で接触していた文字と図形が分離される。
【0019】
ここで得られたエッジ2値画像をラベリング手段3eでラベリングすることで、文字と図形がそれぞれ別の連結成分として抽出される。
【0020】
【発明の効果】
本発明は、エッジグレー画像からエッジの外側を検出し除去することで、文字と図形の間隔が狭いグレースケール画像であっても、エッジ抽出の際の文字と図形の接触を回避する。その結果、従来は図形と接触していた文字を分離し、抽出することが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の構成例
【図2】画素ずれ差分フィルタ及び画素ずれ差分フィルタの出力
【図3】本発明のエッジの外側除去結果
【図4】従来の連結成分の抽出処理フロー例
【図5】ソーベルフィルタ及びソーベルフィルタの出力
【図6】グレースケール画像とエッジ2値画像
【符号の説明】
3a 差分フィルタ手段
3b 画素ずれ差分フィルタ手段
3c 画像変換手段
3d 2値化手段
3e ラベリング手段
Claims (3)
- 画像の連結成分を抽出する、画像処理装置であって、
画像上を走査し、画像のエッジを検出する差分フィルタ手段と、
差分フィルタ手段の出力値が負に変化した場合は、この値が負のピークを越えるまで出力値を0とし、差分フィルタ手段の出力値が正に変化した場合は、この値が正のピークを越えてから0になるまで出力値を0とし、それ以外の場合は差分フィルタ手段の出力値を出力する画像変換手段と、
画像変換手段の出力を2値化する2値化手段と、
2値化手段の出力をラベリングして連結成分を抽出するラベリング手段とを有することを特徴とする画像処理装置。 - 画像の連結成分を抽出する画像処理をコンピュータに行わせるプログラムを記録した記録媒体であって、
画像上を走査し、画像のエッジを検出する差分フィルタ手順と、
差分フィルタ手順の出力値が負に変化した場合は、この値が負のピークを越えるまで出力値を0とし、差分フィルタ手順の出力値が正に変化した場合は、この値が正のピークを越えてから0になるまで出力値を0とし、それ以外の場合は差分フィルタ手順の出力値を出力する画像変換手順と、
画像変換手順の出力を2値化する2値化手順と、
2値化手順の出力をラベリングして連結成分を抽出するラベリング手順を実現させるプログラムを記録したコンピュータ読み取り可能な記録媒体。 - 画像の連結成分を抽出する画像処理方法であって、
差分フィルタにより画像上を走査し、画像のエッジを検出し、
差分フィルタの出力値が負に変化した場合は、この値が負のピークを越えるまで出力値を0とし、差分フィルタの出力値が正に変化した場合は、この値が正のピークを越えてから0になるまで出力値を0とし、それ以外の場合は差分フィルタの出力値を出力し、
前記出力を2値化し、
前記2値化した結果をラベリングして連結成分を抽出することを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36473399A JP3890840B2 (ja) | 1999-12-22 | 1999-12-22 | 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP36473399A JP3890840B2 (ja) | 1999-12-22 | 1999-12-22 | 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006258182A Division JP2007018533A (ja) | 2006-09-25 | 2006-09-25 | 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2001175808A JP2001175808A (ja) | 2001-06-29 |
JP3890840B2 true JP3890840B2 (ja) | 2007-03-07 |
Family
ID=18482538
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP36473399A Expired - Fee Related JP3890840B2 (ja) | 1999-12-22 | 1999-12-22 | 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3890840B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3990375B2 (ja) | 2004-03-30 | 2007-10-10 | 東芝ソリューション株式会社 | 画像処理装置および画像処理方法 |
JP5010627B2 (ja) * | 2009-02-19 | 2012-08-29 | 三菱重工業株式会社 | 文字認識装置及び文字認識方法 |
CN105431866A (zh) * | 2013-07-16 | 2016-03-23 | 株式会社汤山制作所 | 光学字符识别装置 |
-
1999
- 1999-12-22 JP JP36473399A patent/JP3890840B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2001175808A (ja) | 2001-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4261005B2 (ja) | 領域ベースのイメージ2値化システム | |
Fan et al. | Marginal noise removal of document images | |
US8947736B2 (en) | Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern | |
Kasar et al. | Font and background color independent text binarization | |
JP4250483B2 (ja) | 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 | |
US6317223B1 (en) | Image processing system for reducing vertically disposed patterns on images produced by scanning | |
JP4077094B2 (ja) | カラー文書画像認識装置 | |
JP2004272798A (ja) | 画像読み取り装置 | |
Rege et al. | Text-image separation in document images using boundary/perimeter detection | |
JP2000207489A (ja) | 文字抽出方法、装置および記録媒体 | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP2004280334A (ja) | 画像読み取り装置 | |
JP3890840B2 (ja) | 画像処理装置、画像処理方法、及び画像処理プログラムを記録した、コンピュータ読み取り可能な記録媒体 | |
JP5005732B2 (ja) | 画像形成装置及び画像処理方法 | |
CN111445402A (zh) | 一种图像去噪方法及装置 | |
US6983071B2 (en) | Character segmentation device, character segmentation method used thereby, and program therefor | |
JP2003115031A (ja) | 画像処理装置および方法 | |
JP3858559B2 (ja) | 画像処理装置、画像処理方法及び記録媒体 | |
WO2020065980A1 (ja) | 画像処理装置、制御方法及び制御プログラム | |
JP2005198157A (ja) | 画像処理装置および画像処理方法およびコンピュータが読み取り可能なプログラムを格納した記憶媒体およびプログラム | |
US11778122B2 (en) | Apparatus, method, and storage medium for removing shading dots | |
Dey et al. | Removal of gray rubber stamps | |
JP3462727B2 (ja) | 文字列2値化装置 | |
JP3645403B2 (ja) | 文字読取装置および文字読取方法 | |
JP2960468B2 (ja) | 濃淡画像の2値化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060727 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060808 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060925 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061114 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061127 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091215 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101215 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111215 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111215 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121215 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121215 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131215 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |