JP5222776B2 - 画像処理装置及び方法 - Google Patents
画像処理装置及び方法 Download PDFInfo
- Publication number
- JP5222776B2 JP5222776B2 JP2009095125A JP2009095125A JP5222776B2 JP 5222776 B2 JP5222776 B2 JP 5222776B2 JP 2009095125 A JP2009095125 A JP 2009095125A JP 2009095125 A JP2009095125 A JP 2009095125A JP 5222776 B2 JP5222776 B2 JP 5222776B2
- Authority
- JP
- Japan
- Prior art keywords
- character
- processing unit
- identification
- noise
- run
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000012545 processing Methods 0.000 title claims description 183
- 238000000034 method Methods 0.000 title claims description 123
- 230000008569 process Effects 0.000 claims description 107
- 238000012937 correction Methods 0.000 claims description 47
- 238000000605 extraction Methods 0.000 claims description 15
- 239000000284 extract Substances 0.000 claims description 8
- 230000011218 segmentation Effects 0.000 claims description 8
- 230000008878 coupling Effects 0.000 claims description 6
- 238000010168 coupling process Methods 0.000 claims description 6
- 238000005859 coupling reaction Methods 0.000 claims description 6
- 238000003672 processing method Methods 0.000 claims 7
- 238000010586 diagram Methods 0.000 description 9
- 230000009467 reduction Effects 0.000 description 8
- 238000004891 communication Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 7
- 239000013598 vector Substances 0.000 description 6
- 230000002093 peripheral effect Effects 0.000 description 4
- 238000007781 pre-processing Methods 0.000 description 4
- 230000006866 deterioration Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000009499 grossing Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 239000013589 supplement Substances 0.000 description 2
- 206010013647 Drowning Diseases 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000003247 decreasing effect Effects 0.000 description 1
- 238000009792 diffusion process Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
Images
Landscapes
- Character Input (AREA)
- Image Processing (AREA)
Description
図2は、本発明の実施形態の一態様に係る文字認識装置の概略構成例を示すブロック図である。図2による文字認識装置208は、通信装置201と、画像取得装置202と、表示装置203と、外部記憶装置204と、メモリ205と、CPU(Central Processing Unit)206と、キーボードやマウスなどの入力装置207とを備え、これらの各構成はPCIバスなどの通信線で接続されている。図2の装置の代表例として、PC(Personal Computer)にスキャナやOCRが接続されたものがある。
図4乃至8は、斑状ノイズを含む文書画像の例である。斑状ノイズは、その様式の違いにより複数の種類に分けて考えることができる。例えば、図4及び5では文字の大きさが異なるため、個々の文字に発生する斑状ノイズの量が異なる。また、図4及び5では文字を構成するストロークの外部に斑状ノイズが発生しているが、図6及び7では文字を構成するストロークの内部に斑状ノイズが発生している。
本発明の実施形態による文字認識処理を説明する前に、一般的な文字認識処理について説明する。図24は、一般的な文字認識処理の全体を示すフローチャートである。特に断らない限り、各ステップの動作主体はCPU206又は305のような制御部とする。
図1は、本発明の実施形態による文字認識処理の全体を示すフローチャートである。特に断らない限り、各ステップの動作主体はCPU206又は305のような制御部とする。
斑状のノイズ画質判定処理では、まず、水平方向に連続に連なる黒画素であるランが抽出される。また、垂直方向に連続に連なる黒画素であるランが抽出される。水平方向に辿って生成されたランを水平方向ラン、垂直方向に辿って生成されたランを垂直方向ランと呼ぶ。
画質の補正処理では、図13に示すランの結合による補正と図14に示すランの除去による補正が実行される。
孤立突起による斑状ノイズ画質判定処理(S108)では、文字行領域の画像と文字行領域内のランと連結成分が入力され、ランによる斑状ノイズ画質判定とは異なるアプローチで斑状ノイズの検出が行われる。
文字パタン毎の画質補正処理(S109)では、文字パタンと孤立突起による斑状ノイズ画質判定処理(S108)の結果が入力され、図19のように画像縮小(S1902)とぼかし処理(S1904)が適時実行される。
文字識別処理(S110)は、図1に示されるように、小サイズ斑状ノイズパタン選択処理(1101)と基本文字識別処理(1102)と小サイズ斑状ノイズ用文字識別処理(1103)と識別結果統合処理(1104)とから構成される。
本発明は、文字認識処理のための前処理だけでなく、画像に斑状ノイズが存在する場合に画質を改善した後に行われるあらゆる処理の前処理として用いることができる。
102・・・ランによる斑状ノイズ゛画質判定
103・・・入力画像の画質補正
104・・・文字行抽出
105・・・罫線除去
106・・・孤立点ノイズ除去
107・・・文字切り出し
108・・・孤立突起による斑状ノイズ゛画質判定
109・・・文字パタン毎の画質補正
110・・・小サイズ斑状ノイズパタン選択
111・・・基本文字識別
112・・・小サイズ斑状ノイズ用文字識別
113・・・識別結果統合
114・・・知識処理
115・・・認識結果
Claims (7)
- 入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、当該ランの長さ毎に計測したランの頻度分布であるラン長頻度分布を生成し、当該ラン長頻度分布を用いて、複数種類ある斑状のノイズを検出する斑状ノイズ画質判定処理部と、
斑状ノイズ画質判定処理部によって検出された複数の斑状ノイズ判定結果に応じて、前記入力画像に対して画質の補正を行う画質補正処理部と、
前記入力画像内において、文字が並んでいる領域である文字行領域を抽出する文字行抽出処理部と、
前記文字行領域から個々の文字を表す文字パタンを生成する文字切り出し処理部と、
前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別処理部と、を備え、
前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理装置。 - 前記斑状ノイズ画質判定処理部は、前記ラン長頻度分布の各頻度、或いは各頻度を足した値を予め定められた複数の閾値を用いて、閾値処理することによって、前記複数の斑状ノイズを検出することを特徴とする請求項1に記載の画像処理装置。
- 前記画質補正処理部は、
予め定められたラン除去用閾値Tp以下の長さであるランを除去するラン除去処理部と、
隣り合う2つのランを入力とし、それらの距離が予め定められたラン結合用閾値Tq以下である場合にその2つのランを結合するラン結合処理部と、を備え、
前記斑状ノイズ画質判定処理部によって検出された斑状ノイズの種類に応じて、前記ラン除去処理部によるラン除去処理と前記ラン結合処理部によるラン結合処理の実行順番と実行回数を変えながら、前記入力画像の画質を補正することを特徴とする請求項1に記載の画像処理装置。 - 入力画像から文字が並んでいる領域である文字行領域を抽出する文字行抽出処理部と、
文字を含む前記入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、長さが1の水平方向又は垂直方向のランである孤立ランを選出し、上下左右の何れかにのみランが隣接する孤立ランである孤立突起を選出し、当該孤立突起の数を用いて、前記入力画像中に斑状のノイズが含まれるか否かを判定する斑状ノイズ判定処理部と、
前記斑状ノイズ判定処理部による判定結果を用いて、文字パタン毎に画質補正を行う画質補正処理部と、
前記文字行領域から個々の文字を表す文字パタンを生成する文字切り出し処理部と、
前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する文字識別処理部と、を備え、
前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理装置。 - 前記画質補正処理部は、前記斑状ノイズ判定処理部の判定結果に応じて、ぼかし処理を実施するか決定し、当該ぼかし処理を行う場合にはぼかしの度合いを調整して前記文字パタンの画像にぼかし処理を施し、
前記文字識別処理部は、前記ぼかし処理が施された文字パタンに対して文字識別処理を実行することを特徴とする請求項4に記載の画像処理法装置。 - 画像処理装置における画像処理方法であって、
前記画像処理装置は、斑状ノイズ画質判定処理部と、画質補正処理部と、文字行抽出処理部と、文字切り出し処理部と、文字識別処理部と、を備え、
前記画質処理方法は、
前記斑状ノイズ画質判定処理部が、入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、当該ランの長さ毎に計測したランの頻度分布であるラン長頻度分布を生成し、当該ラン長頻度分布を用いて、複数種類ある斑状のノイズを検出する工程と、
前記画質補正処理部が、前記斑状ノイズ画質判定処理部によって検出された複数の斑状ノイズ判定結果に応じて、前記入力画像に対して画質の補正を行う工程と、
前記文字行抽出処理部が、前記入力画像内において、文字が並んでいる領域である文字行領域を抽出する工程と、
前記文字切り出し処理部が、前記文字行領域から個々の文字を表す文字パタンを生成する工程と、
前記文字識別処理部が、前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する工程と、を備え、
前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理方法。 - 画像処理装置における画像処理方法であって、
前記画像処理装置は、文字行抽出処理部と、斑状ノイズ判定処理部と、画質補正処理部と、文字切り出し処理部と、文字識別処理部と、を備え、
前記画質処理方法は、
前記文字行抽出処理部が、入力画像から文字が並んでいる領域である文字行領域を抽出する工程と、
前記斑状ノイズ判定処理部が、文字を含む前記入力画像から水平方向或いは垂直方向に連なる黒画素の集合であるランを生成し、長さが1の水平方向又は垂直方向のランである孤立ランを選出し、上下左右の何れかにのみランが隣接する孤立ランである孤立突起を選出し、当該孤立突起の数を用いて、前記入力画像中に斑状のノイズが含まれるか否かを判定する工程と、
前記画質補正処理部が、前記斑状ノイズ判定処理部による判定結果を用いて、文字パタン毎に画質補正を行う工程と、
前記文字切り出し処理部が、前記文字行領域から個々の文字を表す文字パタンを生成すると、
前記文字識別処理部が、前記生成された文字パタンの特徴を抽出し、予め用意された識別辞書に存在する各文字種の特徴との類似度を算出する工程と、を備え、
前記文字識別処理部は、前記文字パタンにおける文字サイズが所定サイズ以下の場合には、基本となる文字パタンを学習した基本識別辞書を用いて識別処理する基本識別処理と斑状ノイズを含み小さいサイズのパタンを学習した小サイズ斑状ノイズ用識別辞書を用いて識別処理する文字識別処理を実行してそれらの結果を統合して識別結果とし、前記文字サイズが前記所定サイズより大きい場合には前記基本識別処理の結果を識別結果とすることを特徴とする画像処理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009095125A JP5222776B2 (ja) | 2009-04-09 | 2009-04-09 | 画像処理装置及び方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009095125A JP5222776B2 (ja) | 2009-04-09 | 2009-04-09 | 画像処理装置及び方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010244472A JP2010244472A (ja) | 2010-10-28 |
JP5222776B2 true JP5222776B2 (ja) | 2013-06-26 |
Family
ID=43097390
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009095125A Expired - Fee Related JP5222776B2 (ja) | 2009-04-09 | 2009-04-09 | 画像処理装置及び方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5222776B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5830996B2 (ja) | 2011-07-19 | 2015-12-09 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP7267854B2 (ja) * | 2019-06-26 | 2023-05-02 | 日立チャネルソリューションズ株式会社 | 帳票認識装置、帳票認識方法、及び帳票認識システム |
CN111508017B (zh) * | 2020-04-08 | 2023-11-03 | 中导光电设备股份有限公司 | 一种弱对比度定位标记中心的方法和系统 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0390971A (ja) * | 1989-09-01 | 1991-04-16 | Oki Electric Ind Co Ltd | 文字背景処理装置 |
JPH05120488A (ja) * | 1991-10-29 | 1993-05-18 | Ricoh Co Ltd | 線図形認識方法 |
JP3163698B2 (ja) * | 1991-12-24 | 2001-05-08 | 松下電器産業株式会社 | 文字認識方法 |
JP3449392B2 (ja) * | 1996-08-27 | 2003-09-22 | 日本電信電話株式会社 | 識別関数学習方法 |
JPH1196296A (ja) * | 1997-09-19 | 1999-04-09 | Nippon Telegr & Teleph Corp <Ntt> | 帳票イメージ処理方法および装置 |
JP4050677B2 (ja) * | 2003-05-29 | 2008-02-20 | 株式会社リコー | 画像処理装置、画像処理方法及びプログラム並びに記録媒体 |
-
2009
- 2009-04-09 JP JP2009095125A patent/JP5222776B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2010244472A (ja) | 2010-10-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5624004B2 (ja) | ハーフトーンパターンで印刷されたグレーまたは淡色テキストを含む、スキャンされた文書画像を2値化するための方法 | |
JP5566811B2 (ja) | プリントアンドスキャン文書の画像評価のためのボケ除去および監視適応的スレッショルディング | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
US7623712B2 (en) | Image processing method and apparatus | |
US8594431B2 (en) | Adaptive partial character recognition | |
JP4469873B2 (ja) | 画像文書の検索装置、プログラム、及び記録媒体 | |
US8384964B2 (en) | Image processing apparatus and image processing method | |
WO2007127085A1 (en) | Generating a bitonal image from a scanned colour image | |
JP2007504719A (ja) | 組み込みアプリケーションに適した、画像における赤目の検出と補正を行うシステム及び方法 | |
JP2001297303A (ja) | 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US8611658B2 (en) | Image processing apparatus and image processing method | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
US20210192262A1 (en) | Apparatus for processing image, storage medium, and image processing method | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
JP5222776B2 (ja) | 画像処理装置及び方法 | |
CN114863431A (zh) | 一种文本检测方法、装置及设备 | |
US20230062113A1 (en) | Information processing apparatus, information processing method and non-transitory storage medium | |
US20090290797A1 (en) | Image processing for storing objects separated from an image in a storage device | |
JP2008147712A (ja) | 画像処理装置および画像処理方法 | |
JP3830350B2 (ja) | カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体 | |
JP5517028B2 (ja) | 画像処理装置 | |
Sherkat et al. | Use of colour for hand-filled form analysis and recognition | |
KR20140063378A (ko) | 화상형성장치, 화상형성방법 및 컴퓨터 판독가능 기록매체 | |
Konya et al. | Adaptive methods for robust document image understanding | |
US20220415025A1 (en) | Information processing apparatus, information processing method, non-transitory computer-readable storage medium storing program, and system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120105 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120626 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20120824 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20130212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20130311 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20160315 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |