JP3989647B2 - 画像処理方法,装置および記録媒体 - Google Patents

画像処理方法,装置および記録媒体 Download PDF

Info

Publication number
JP3989647B2
JP3989647B2 JP10267699A JP10267699A JP3989647B2 JP 3989647 B2 JP3989647 B2 JP 3989647B2 JP 10267699 A JP10267699 A JP 10267699A JP 10267699 A JP10267699 A JP 10267699A JP 3989647 B2 JP3989647 B2 JP 3989647B2
Authority
JP
Japan
Prior art keywords
processing target
value
threshold value
image
binarization threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP10267699A
Other languages
English (en)
Other versions
JP2000293629A (ja
Inventor
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10267699A priority Critical patent/JP3989647B2/ja
Publication of JP2000293629A publication Critical patent/JP2000293629A/ja
Application granted granted Critical
Publication of JP3989647B2 publication Critical patent/JP3989647B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、紙面に記入された文字を光学的に認識する方法,装置に関し、濃淡画像から文字が鮮明に再現された二値画像を生成し、文字認識の精度向上を図る画像処理方法および装置に関する。
【0002】
【従来の技術】
光学的文字認識方法には現在多くの手法が提案されているが、そのほとんどが二値画像を対象としたものであるので、二値画像の状態が認識精度を大きく左右する。そのため、文字認識に好適な二値画像を生成するために、多くの手法が提案されている。特開平10−143608号公報に記載の発明は、濃淡画像を適当な閾値で二値化し、できた二値画像上の平均線幅を計算し、その値が規定範囲外にある場合は、文字認識に不適であると判断して二値化をやり直すことにより、文字認識に好適な二値画像を生成することを目的としている。
【0003】
【発明が解決しようとする課題】
現在流通している帳票には、図6(A)に示すように、背景が複数の色で印刷されているものが存在する。記入される文字は大抵明度の低い色(黒,紺など)であるため、白でない背景は、明度の高い色で印刷されており、そこに文字が記入された場合でも人間が見て見づらいということはない。以下、このような領域を中間色領域と呼ぶことにする。
ところが、この明度の高い色はほとんどの場合、比較的明度の低い色のドットを非常に細かく印刷することで明度の高い色を表現している。この中間色領域部分を二値化した場合、図6(B)に示すように、二値化閾値によっては数ドット程度の細かいノイズ(黒画素)が非常に多く現われることがある。
【0004】
上述の従来技術では、これら細かいノイズを線幅判定に加えてしまうため、正しい閾値決定が難しい。また、領域内に文字が全くない場合にも、ノイズを手がかりに二値化閾値の決定を行うことになり、誤ってノイズを文字画像として認識部に渡すことになりどちらも誤認識の原因となる。よって、文字がない領域では認識部にノイズを渡さないことが必要となる
【0005】
【課題を解決するための手段】
上記目的を達成するために、請求項1の発明は、画像処理装置おける、処理対象画像の二値化閾値を設定するための画像処理方法において、入力手段が、処理対象画像を入力するステップと、前記処理対象画像中の処理対象領域において、判別分析法により該処理対象領域の二値化閾値を算出するステップと、前記算出された二値化閾値と、前記処理対象領域内の各画素値との差の二乗平均値を計算するステップと、前記計算された二乗平均値が所定の閾値以下の場合、前記処理対象領域には文字がないと判断し、該処理対象領域を白画素で埋めるステップと、前記計算された二乗平均値が所定の閾値より大きい場合、前記処理対象領域内のエッジの数と画素数とから評価値を算出し、該評価値と所定の閾値とを比較することにより前記二値化閾値を評価するステップと、前記評価の結果、前記閾値より前記評価値が大きい場合には前記二値化閾値を下げることにより処理対象画像の二値化閾値を設定し、小さい場合には前記二値化閾値を処理対象画像の二値化閾値として設定するステップと、を備えることを特徴としている。
請求項2の発明は、請求項1の発明において、前記処理対象領域は、前記処理対象画像における文字が記入された領域であることを特徴としている。
【0006】
請求項の発明は、処理対象画像を入力する画像入力手段と、前記処理対象画像中の処理対象領域において、判別分析法により該処理対象領域の二値化閾値を算出する二値化閾値算出手段と、前記算出された二値化閾値と、前記処理対象領域内の各画素値との差の二乗平均値を計算する二乗平均値算出手段と、前記計算された二乗平均値が所定の閾値以下の場合、前記処理対象領域には文字がないと判断し、該処理対象領域を白画素で埋める手段と、前記計算された二乗平均値が所定の閾値より大きい場合、前記処理対象領域内のエッジ数と画素数とから該処理対象領域の評価値を算出し、該評価値と所定の閾値とを比較することにより前記二値化閾値を評価する手段と、前記評価の結果、前記閾値より前記評価値が大きい場合には前記二値化閾値を下げることにより処理対象画像の二値化閾値を設定し、小さい場合には前記二値化閾値を処理対象画像の二値化閾値として設定する手段と、を備えることを特徴としている。
請求項の発明は、請求項の発明において、前記処理対象領域は、前記処理対象画像における文字が記入された領域であることを特徴としている。
【0007】
請求項の発明は、コンピュータを、請求項3または4のいずれかの発明の各手段として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体である。
【0008】
【発明の実施の形態】
(実施例1)
図1は、本発明の実施例1を説明するための構成図で、図中、1は文字認識を行いたい帳票原稿を濃淡画像として読み込む、スキャナ等の濃淡画像入力手段、2は帳票上の文字の記入欄の位置を特定する文字記入位置特定手段、3はある文字記入欄の二値化閾値を決める二値化閾値算出手段、4は二値化閾値算出手段3で計算された閾値と、領域内の画素値の差の2乗平均値を求める、画素値差二乗平均値算出手段、5は二値化閾値算出手段3で計算された閾値で二値化した場合の、領域内の二値化状態を評価する値を計算する、領域内二値化状態評価値算出手段、6は領域内二値化状態評価値算出手段5で二値化状態が良くない場合に二値化閾値を設定し直す二値化閾値再設定手段、7は最終的に決定された閾値で二値画像を生成する二値画像生成手段である。
【0009】
図2は、本発明の実施例1の処理手順を説明するためのフロー図で、まず、濃淡画像入力手段1を用いて画像を入力する(S11)。次に、文字の記入位置を文字記入位置特定手段2により特定する(S12)。これには様々な方法が考えられるが、特開平10−91783号公報にあるように、未記入の同一フォーマットの帳票画像との位置あわせを行い、この画像上の位置座標値で定義された文字記入欄から処理対象の画像上の文字記入欄の位置を推定する方法などを用いる。
【0010】
文字記入欄の位置推定ののち、二値化閾値算出手段3により、二値化閾値の算出を行う(S13)。ここでは判別分析法で閾値を決定する。判別分析法とは、画像の濃度値ヒストグラムにおいて、濃度値の集合を閾値tで2つのクラスに分割したときに、クラス内の分散が最小、クラス間の分散が最小になるようなtを閾値として決める方法である。
【0011】
具体的には、閾値t未満の濃度値のクラスを1、t以上のクラスを2とおき、それぞれのクラス内の分散をv1,v2、濃度平均値をe1,e2、画素数をn1,n2とおいたとき、クラス内分散vcとクラス間分散vb
c(t)=n11+n22
b(t)=n12(e1−e22
で定義する。このとき
b(t)/vc(t)
が最大となるtを閾値とする。
【0012】
判別分析法で閾値を決定すると、白い領域に文字が記入された場合に加え、中間色領域に文字が記入された場合にも背景を白、文字を黒としてきれいに二値化が行える。ところが、領域内に文字が存在しない場合、クラスの分割を強引に行うことになるので、できた二値画像は白黒入り交じった画像になってしまう(図6(B)参照)。この画像を認識部に渡すと文字の存在しない領域に対して文字があるとの認識結果を生みかねない。画素値差二乗平均値算出手段4により、文字の有無を判定する(S14)。
【0013】
画素値差二乗平均値をAv、領域内の各画素値をpi、画素総数をN、S13で求めた閾値をtとすると
【0014】
【数1】
Figure 0003989647
【0015】
と書くことができる。Avは、文字がない領域では値が小さくなる傾向がある。もちろん、網掛け領域では一様濃度の領域よりは値は大きくなるが、それでも文字が記入された場合よりずっと小さな値をとる。したがって、あらかじめ定めておいた値よりAvが小さい場合には(S15)、文字がないと判断できるので、この領域は白画素で埋める二値化を行う(S16)。
【0016】
ここで文字があると判断された場合には、領域内二値化状態評価値算出手段5により、領域内の二値化状態を調べる。図3に示すように、領域内の一部分だけに網がかかっている場合、判別分析法で二値化を行うと網が二値画像として再現されてしまい、認識に悪い影響を及ぼす。そこで、本実施例では画素の連結成分の個数を用いて評価値を求める。
【0017】
まず、領域内のエッジ数を数える(S17)。エッジは、図4に示すように、領域内を横方向に走査し、白黒が変動する回数を合計(図示例の場合、横方向合計16)したあと、縦方向に走査して同様の操作を行い(図示例の場合、縦方向合計20)、それらを合計して求める(図示例の場合、領域内のエッジ数=16+20=36)。
【0018】
次に、評価値を求める(S18)。評価値Rは、エッジ数をe、領域内の総画素数をNとおいて
R=e2/N
で計算する。Rは文字がない領域や、文字はあるものの領域内の一部だけに網かけが施されている領域に判別分析法で閾値を決定した場合に現われる、白黒入り交じった二値画像に対しては値が大きくなる傾向がある。よって、Rの大小で、二値化状態を判断できる。Rが、あらかじめ定められた値よりも大きい場合は(S19)、二値化状態が良くないと判断して、二値化閾値再設定手段6により閾値を下げて(黒画素を減らすように変更して)、再度評価値を計算する(S20)。そうでない場合は、この閾値による二値化状態が良好と判断し、二値画像生成手段7により領域内を二値化する(S21)。
【0019】
このようにして、認識対象となっている領域全てに二値化処理を行うまで処理を繰り返し(S22)、終了したなら二値画像を出力して(S23)認識部に渡し、処理を終了する。
【0020】
(実施例2)
図5は、本発明の実施例2の構成を示す。本実施例は、ソフトウェアによって実現する場合の実施例であり、CPU11,メモリ12,ハードディスク13,入力装置14,CD−ROMドライブ15,ディスプレイ16,マウスなどからなる汎用の処理装置を用意する。CD−ROMなどの記録媒体17には、本発明の二値画像生成の処理機能や処理手順を実現させるためのプログラムが記録されている。また、処理対象の原稿画像は、例えば、ハードディスク13などに格納されている。CPU11は、記録媒体17から上記した処理機能,手順を実現するプログラムを読み出し実行し、二値画像生成の結果をディスプレイ16などに出力する。
【0021】
【発明の効果】
以上説明したように、本発明によれば、以下の効果が得られる。
1.領域ごとに背景色が異なる帳票に対しても、文字認識に好適な二値画像の生成が可能である。
2.単一領域内の一部にだけ網かけが施されている画像でも、文字認識に好適な二値画像生成が可能である。
【図面の簡単な説明】
【図1】 本発明の実施例1を説明するための構成図である。
【図2】 本発明の実施例1の処理手順を説明するためのフロー図である。
【図3】 領域内の一部分だけに網がかかっている場合を示す図である。
【図4】 エッジの数え方を説明するための図である。
【図5】 本発明の実施例2の構成を示す図である。
【図6】 背景が複数の色で印刷されているものが存在する場合の処理例を示す図である。
【符号の説明】
1…濃淡画像入力手段、2…文字記入位置特定手段、3…二値化閾値算出手段、4…画素値差二乗平均値算出手段、5…領域内二値化状態評価値算出手段、6…二値化閾値再設定手段、7…二値画像生成手段、11…CPU、12…メモリ、13…ハードディスク、14…入力装置、15…CD−ROMドライブ、16…ディスプレイ、17…記録媒体。

Claims (5)

  1. 画像処理装置おける、処理対象画像の二値化閾値を設定するための画像処理方法において、入力手段が、処理対象画像を入力するステップと、前記処理対象画像中の処理対象領域において、判別分析法により該処理対象領域の二値化閾値を算出するステップと、前記算出された二値化閾値と、前記処理対象領域内の各画素値との差の二乗平均値を計算するステップと、前記計算された二乗平均値が所定の閾値以下の場合、前記処理対象領域には文字がないと判断し、該処理対象領域を白画素で埋めるステップと、前記計算された二乗平均値が所定の閾値より大きい場合、前記処理対象領域内のエッジの数と画素数とから評価値を算出し、該評価値と所定の閾値とを比較することにより前記二値化閾値を評価するステップと、前記評価の結果、前記閾値より前記評価値が大きい場合には前記二値化閾値を下げることにより処理対象画像の二値化閾値を設定し、小さい場合には前記二値化閾値を処理対象画像の二値化閾値として設定するステップと、を備えることを特徴とする画像処理方法。
  2. 前記処理対象領域は、前記処理対象画像における文字が記入された領域であることを特徴とする請求項1に記載の画像処理方法。
  3. 処理対象画像を入力する画像入力手段と、前記処理対象画像中の処理対象領域において、判別分析法により該処理対象領域の二値化閾値を算出する二値化閾値算出手段と、前記算出された二値化閾値と、前記処理対象領域内の各画素値との差の二乗平均値を計算する二乗平均値算出手段と、前記計算された二乗平均値が所定の閾値以下の場合、前記処理対象領域には文字がないと判断し、該処理対象領域を白画素で埋める手段と、前記計算された二乗平均値が所定の閾値より大きい場合、前記処理対象領域内のエッジ数と画素数とから該処理対象領域の評価値を算出し、該評価値と所定の閾値とを比較することにより前記二値化閾値を評価する手段と、前記評価の結果、前記閾値より前記評価値が大きい場合には前記二値化閾値を下げることにより処理対象画像の二値化閾値を設定し、小さい場合には前記二値化閾値を処理対象画像の二値化閾値として設定する手段と、を備えることを特徴とする画像処理装置。
  4. 前記処理対象領域は、前記処理対象画像における文字が記入された領域であることを特徴とする請求項に記載の画像処理装置。
  5. コンピュータを、請求項3または4のいずれかに記載した画像処理装置の各手段として機能させるためのプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP10267699A 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体 Expired - Fee Related JP3989647B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10267699A JP3989647B2 (ja) 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10267699A JP3989647B2 (ja) 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2000293629A JP2000293629A (ja) 2000-10-20
JP3989647B2 true JP3989647B2 (ja) 2007-10-10

Family

ID=14333847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10267699A Expired - Fee Related JP3989647B2 (ja) 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3989647B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615880A (zh) * 2018-10-29 2019-04-12 浙江浙大列车智能化工程技术研究中心有限公司 一种基于雷达图像处理的车流量测量方法

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156868B (zh) * 2011-03-31 2013-03-13 汉王科技股份有限公司 图像二值化方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615880A (zh) * 2018-10-29 2019-04-12 浙江浙大列车智能化工程技术研究中心有限公司 一种基于雷达图像处理的车流量测量方法

Also Published As

Publication number Publication date
JP2000293629A (ja) 2000-10-20

Similar Documents

Publication Publication Date Title
JP3078844B2 (ja) 文書中の前景情報を背景情報から分離する方法
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
US5583659A (en) Multi-windowing technique for thresholding an image using local image properties
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP3809404B2 (ja) 画像処理方法、装置およびシステム
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
US7411699B2 (en) Method and apparatus to enhance digital image quality
JP2009535899A (ja) 走査されたカラー画像からの複調画像の生成
US7149349B2 (en) Scanning and detecting a number of images
CN113688838A (zh) 红色笔迹提取方法、系统、可读存储介质及计算机设备
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP2002199206A (ja) メッセージ埋込並びに抽出方法、装置および媒体
JPH09130614A (ja) 画像処理装置
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
JP3985928B2 (ja) 画像処理方法、画像処理装置、文字認識装置及び記憶媒体
JP2871601B2 (ja) 文字列検出装置及び方法
JP3698867B2 (ja) 円形パターン判定方法、装置および記録媒体
JP3772845B2 (ja) 画像処理プログラム、画像処理装置、および撮影装置
JP3830350B2 (ja) カラー画像処理方法、カラー画像処理装置、プログラム、及び記録媒体
JP2000331118A (ja) 画像処理装置及び記録媒体
JP3763954B2 (ja) 文字認識用の学習データ作成方法および記録媒体
JPH0624014B2 (ja) 濃淡画像の処理方法
JP2000261653A (ja) 画像処理装置
JPH10269352A (ja) 画像処理装置および方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040616

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070718

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130727

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees