JP2000293629A - 画像処理方法,装置および記録媒体 - Google Patents

画像処理方法,装置および記録媒体

Info

Publication number
JP2000293629A
JP2000293629A JP11102676A JP10267699A JP2000293629A JP 2000293629 A JP2000293629 A JP 2000293629A JP 11102676 A JP11102676 A JP 11102676A JP 10267699 A JP10267699 A JP 10267699A JP 2000293629 A JP2000293629 A JP 2000293629A
Authority
JP
Japan
Prior art keywords
image
binarization threshold
value
region
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11102676A
Other languages
English (en)
Other versions
JP3989647B2 (ja
Inventor
Fumihiro Hasegawa
史裕 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP10267699A priority Critical patent/JP3989647B2/ja
Publication of JP2000293629A publication Critical patent/JP2000293629A/ja
Application granted granted Critical
Publication of JP3989647B2 publication Critical patent/JP3989647B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】 領域ごとに背景色が異なる帳票に対しても、
単一領域内の一部にだけ網かけが施されている画像で
も、文字認識に好適な二値画像の生成を可能とする。 【解決手段】 濃淡画像から光学的文字認識に適した二
値画像を生成する際に、濃淡画像を入力(S11)、文
字認識の対象となる前記画像上の領域を特定し(S1
2)、各領域毎に二値化閾値を算出する(S13)。算
出された二値化閾値と領域内の各画素値との差の二乗平
均を計算し(S14)、その値が規定値以上の場合(S
15)、各文字領域内のエッジを数える(S17)。こ
のエッジの数から二値化状態を表す評価値を算出(S1
8)、前記評価値の値によっては二値化閾値を再設定し
(S20)、得られた二値化閾値(S22)により二値
画像を生成する(S23)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、紙面に記入された
文字を光学的に認識する方法,装置に関し、濃淡画像か
ら文字が鮮明に再現された二値画像を生成し、文字認識
の精度向上を図る画像処理方法および装置に関する。
【0002】
【従来の技術】光学的文字認識方法には現在多くの手法
が提案されているが、そのほとんどが二値画像を対象と
したものであるので、二値画像の状態が認識精度を大き
く左右する。そのため、文字認識に好適な二値画像を生
成するために、多くの手法が提案されている。特開平1
0−143608号公報に記載の発明は、濃淡画像を適
当な閾値で二値化し、できた二値画像上の平均線幅を計
算し、その値が規定範囲外にある場合は、文字認識に不
適であると判断して二値化をやり直すことにより、文字
認識に好適な二値画像を生成することを目的としてい
る。
【0003】
【発明が解決しようとする課題】現在流通している帳票
には、図6(A)に示すように、背景が複数の色で印刷
されているものが存在する。記入される文字は大抵明度
の低い色(黒,紺など)であるため、白でない背景は、
明度の高い色で印刷されており、そこに文字が記入され
た場合でも人間が見て見づらいということはない。以
下、このような領域を中間色領域と呼ぶことにする。と
ころが、この明度の高い色はほとんどの場合、比較的明
度の低い色のドットを非常に細かく印刷することで明度
の高い色を表現している。この中間色領域部分を二値化
した場合、図6(B)に示すように、二値化閾値によっ
ては数ドット程度の細かいノイズ(黒画素)が非常に多
く現われることがある。
【0004】上述の従来技術では、これら細かいノイズ
を線幅判定に加えてしまうため、正しい閾値決定が難し
い。また、領域内に文字が全くない場合にも、ノイズを
手がかりに二値化閾値の決定を行うことになり、誤って
ノイズを文字画像として認識部に渡すことになりどちら
も誤認識の原因となる。よって、線幅に頼らず領域毎に
最適な二値化閾値を与えることと、文字がない領域では
認識部にノイズを渡さないことが必要となる。図6
(C)に、本発明による二値化の例を示す。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、請求項1の発明は、濃淡画像から光学的文字認識に
適した二値画像を生成する方法であって、濃淡画像を入
力し、該画像上の文字認識の対象となる領域を特定し、
各領域毎に二値化閾値を算出し、この算出された二値化
閾値と領域内の各画素値との差の二乗平均を計算し、各
文字領域内のエッジを数え、このエッジの数から二値化
状態を表す評価値を算出し、この評価値の値によっては
二値化閾値を再設定し、得られた二値化閾値により二値
画像を生成することを特徴としている。
【0006】請求項2の発明は、濃淡画像を入力する手
段と、文字認識の対象となる前記画像上の領域を特定す
る手段と、各領域毎に二値化閾値を算出する手段と、前
記算出された二値化閾値と領域内の各画素値との差の二
乗平均を計算する手段と、各文字領域内のエッジを数え
る手段と、前記エッジの数から二値化状態を表す評価値
を算出する手段と、前記評価値の値によっては二値化閾
値を再設定する手段と、得られた二値化閾値により二値
画像を生成する手段とを備えることを特徴としている。
【0007】請求項3の発明は、濃淡画像を入力する機
能と、文字認識の対象となる前記画像上の領域を特定す
る機能と、各領域毎に二値化閾値を算出する機能と、前
記算出された二値化閾値と領域内の各画素値との差の二
乗平均を計算する機能と、各文字領域内のエッジを数え
る機能と、前記エッジ数から二値化状態を表す評価値を
算出する機能と、前記評価値の値によっては二値化閾値
を再設定する機能と、得られた二値化閾値により二値画
像を生成する機能とを備えることを特徴としている。
【0008】
【発明の実施の形態】(実施例1)図1は、本発明の実
施例1を説明するための構成図で、図中、1は文字認識
を行いたい帳票原稿を濃淡画像として読み込む、スキャ
ナ等の濃淡画像入力手段、2は帳票上の文字の記入欄の
位置を特定する文字記入位置特定手段、3はある文字記
入欄の二値化閾値を決める二値化閾値算出手段、4は二
値化閾値算出手段3で計算された閾値と、領域内の画素
値の差の2乗平均値を求める、画素値差二乗平均値算出
手段、5は二値化閾値算出手段3で計算された閾値で二
値化した場合の、領域内の二値化状態を評価する値を計
算する、領域内二値化状態評価値算出手段、6は領域内
二値化状態評価値算出手段5で二値化状態が良くない場
合に二値化閾値を設定し直す二値化閾値再設定手段、7
は最終的に決定された閾値で二値画像を生成する二値画
像生成手段である。
【0009】図2は、本発明の実施例1の処理手順を説
明するためのフロー図で、まず、濃淡画像入力手段1を
用いて画像を入力する(S11)。次に、文字の記入位
置を文字記入位置特定手段2により特定する(S1
2)。これには様々な方法が考えられるが、特開平10
−91783号公報にあるように、未記入の同一フォー
マットの帳票画像との位置あわせを行い、この画像上の
位置座標値で定義された文字記入欄から処理対象の画像
上の文字記入欄の位置を推定する方法などを用いる。
【0010】文字記入欄の位置推定ののち、二値化閾値
算出手段3により、二値化閾値の算出を行う(S1
3)。ここでは判別分析法で閾値を決定する。判別分析
法とは、画像の濃度値ヒストグラムにおいて、濃度値の
集合を閾値tで2つのクラスに分割したときに、クラス
内の分散が最小、クラス間の分散が最小になるようなt
を閾値として決める方法である。
【0011】具体的には、閾値t未満の濃度値のクラス
を1、t以上のクラスを2とおき、それぞれのクラス内
の分散をv1,v2、濃度平均値をe1,e2、画素数をn
1,n2とおいたとき、クラス内分散vcとクラス間分散
bを vc(t)=n11+n22b(t)=n12(e1−e22 で定義する。このとき vb(t)/vc(t) が最大となるtを閾値とする。
【0012】判別分析法で閾値を決定すると、白い領域
に文字が記入された場合に加え、中間色領域に文字が記
入された場合にも背景を白、文字を黒としてきれいに二
値化が行える。ところが、領域内に文字が存在しない場
合、クラスの分割を強引に行うことになるので、できた
二値画像は白黒入り交じった画像になってしまう(図6
(B)参照)。この画像を認識部に渡すと文字の存在し
ない領域に対して文字があるとの認識結果を生みかねな
い。画素値差二乗平均値算出手段4により、文字の有無
を判定する(S14)。
【0013】画素値差二乗平均値をAv、領域内の各画
素値をpi、画素総数をN、S13で求めた閾値をtと
すると
【0014】
【数1】
【0015】と書くことができる。Avは、文字がない
領域では値が小さくなる傾向がある。もちろん、網掛け
領域では一様濃度の領域よりは値は大きくなるが、それ
でも文字が記入された場合よりずっと小さな値をとる。
したがって、あらかじめ定めておいた値よりAvが小さ
い場合には(S15)、文字がないと判断できるので、
この領域は白画素で埋める二値化を行う(S16)。
【0016】ここで文字があると判断された場合には、
領域内二値化状態評価値算出手段5により、領域内の二
値化状態を調べる。図3に示すように、領域内の一部分
だけに網がかかっている場合、判別分析法で二値化を行
うと網が二値画像として再現されてしまい、認識に悪い
影響を及ぼす。そこで、本実施例では画素の連結成分の
個数を用いて評価値を求める。
【0017】まず、領域内のエッジ数を数える(S1
7)。エッジは、図4に示すように、領域内を横方向に
走査し、白黒が変動する回数を合計(図示例の場合、横
方向合計16)したあと、縦方向に走査して同様の操作
を行い(図示例の場合、縦方向合計20)、それらを合
計して求める(図示例の場合、領域内のエッジ数=16
+20=36)。
【0018】次に、評価値を求める(S18)。評価値
Rは、エッジ数をe、領域内の総画素数をNとおいて R=e2/N で計算する。Rは文字がない領域や、文字はあるものの
領域内の一部だけに網かけが施されている領域に判別分
析法で閾値を決定した場合に現われる、白黒入り交じっ
た二値画像に対しては値が大きくなる傾向がある。よっ
て、Rの大小で、二値化状態を判断できる。Rが、あら
かじめ定められた値よりも大きい場合は(S19)、二
値化状態が良くないと判断して、二値化閾値再設定手段
6により閾値を下げて(黒画素を減らすように変更し
て)、再度評価値を計算する(S20)。そうでない場
合は、この閾値による二値化状態が良好と判断し、二値
画像生成手段7により領域内を二値化する(S21)。
【0019】このようにして、認識対象となっている領
域全てに二値化処理を行うまで処理を繰り返し(S2
2)、終了したなら二値画像を出力して(S23)認識
部に渡し、処理を終了する。
【0020】(実施例2)図5は、本発明の実施例2の
構成を示す。本実施例は、請求項3の、ソフトウェアに
よって実現する場合の実施例であり、CPU11,メモ
リ12,ハードディスク13,入力装置14,CD−R
OMドライブ15,ディスプレイ16,マウスなどから
なる汎用の処理装置を用意する。CD−ROMなどの記
録媒体17には、本発明の二値画像生成の処理機能や処
理手順を実現させるためのプログラムが記録されてい
る。また、処理対象の原稿画像は、例えば、ハードディ
スク13などに格納されている。CPU11は、記録媒
体17から上記した処理機能,手順を実現するプログラ
ムを読み出し実行し、二値画像生成の結果をディスプレ
イ16などに出力する。
【0021】
【発明の効果】以上説明したように、本発明によれば、
以下の効果が得られる。 1.領域ごとに背景色が異なる帳票に対しても、文字認
識に好適な二値画像の生成が可能である。 2.単一領域内の一部にだけ網かけが施されている画像
でも、文字認識に好適な二値画像生成が可能である。
【図面の簡単な説明】
【図1】 本発明の実施例1を説明するための構成図で
ある。
【図2】 本発明の実施例1の処理手順を説明するため
のフロー図である。
【図3】 領域内の一部分だけに網がかかっている場合
を示す図である。
【図4】 エッジの数え方を説明するための図である。
【図5】 本発明の実施例2の構成を示す図である。
【図6】 背景が複数の色で印刷されているものが存在
する場合の処理例を示す図である。
【符号の説明】
1…濃淡画像入力手段、2…文字記入位置特定手段、3
…二値化閾値算出手段、4…画素値差二乗平均値算出手
段、5…領域内二値化状態評価値算出手段、6…二値化
閾値再設定手段、7…二値画像生成手段、11…CP
U、12…メモリ、13…ハードディスク、14…入力
装置、15…CD−ROMドライブ、16…ディスプレ
イ、17…記録媒体。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 濃淡画像から光学的文字認識に適した二
    値画像を生成する方法であって、濃淡画像を入力し、該
    濃淡画像上の文字認識の対象となる領域を特定し、各領
    域毎に二値化閾値を算出し、この算出された二値化閾値
    と領域内の各画素値との差の二乗平均を計算し、各文字
    領域内のエッジの数を数え、このエッジの数から二値化
    状態を表す評価値を算出し、この評価値の値によっては
    二値化閾値を再設定し、得られた二値化閾値により二値
    画像を生成することを特徴とする画像処理方法。
  2. 【請求項2】 濃淡画像から光学的文字認識に適した二
    値画像を生成する装置であって、濃淡画像を入力する手
    段と、該濃淡画像上の文字認識の対象となる領域を特定
    する手段と、各領域毎に二値化閾値を算出する手段と、
    前記算出された二値化閾値と領域内の各画素値との差の
    二乗平均を計算する手段と、各文字領域内のエッジの数
    を数える手段と、前記エッジの数から二値化状態を表す
    評価値を算出する手段と、前記評価値の値によっては二
    値化閾値を再設定する手段と、得られた二値化閾値によ
    り二値画像を生成する手段とを備えることを特徴とする
    画像処理装置。
  3. 【請求項3】 濃淡画像から光学的文字認識に適した二
    値画像を生成する機能をコンピューターに実現させるプ
    ログラムを格納した記録媒体であって、濃淡画像を入力
    する機能と、文字認識の対象となる前記画像上の領域を
    特定する機能と、各領域毎に二値化閾値を算出する機能
    と、前記算出された二値化閾値と領域内の各画素値との
    差の二乗平均を計算する機能と、各文字領域内のエッジ
    を数える機能と、前記エッジ数から二値化状態を表す評
    価値を算出する機能と、前記評価値の値によっては二値
    化閾値を再設定する機能と、得られた二値化閾値により
    二値画像を生成する機能とを備えることを特徴とする画
    像処理方法を格納した、コンピューター読み取り可能な
    記録媒体。
JP10267699A 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体 Expired - Fee Related JP3989647B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP10267699A JP3989647B2 (ja) 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP10267699A JP3989647B2 (ja) 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体

Publications (2)

Publication Number Publication Date
JP2000293629A true JP2000293629A (ja) 2000-10-20
JP3989647B2 JP3989647B2 (ja) 2007-10-10

Family

ID=14333847

Family Applications (1)

Application Number Title Priority Date Filing Date
JP10267699A Expired - Fee Related JP3989647B2 (ja) 1999-04-09 1999-04-09 画像処理方法,装置および記録媒体

Country Status (1)

Country Link
JP (1) JP3989647B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156868A (zh) * 2011-03-31 2011-08-17 汉王科技股份有限公司 图像二值化方法和装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109615880B (zh) * 2018-10-29 2020-10-23 浙江浙大列车智能化工程技术研究中心有限公司 一种基于雷达图像处理的车流量测量方法

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102156868A (zh) * 2011-03-31 2011-08-17 汉王科技股份有限公司 图像二值化方法和装置
CN102156868B (zh) * 2011-03-31 2013-03-13 汉王科技股份有限公司 图像二值化方法和装置

Also Published As

Publication number Publication date
JP3989647B2 (ja) 2007-10-10

Similar Documents

Publication Publication Date Title
US7292375B2 (en) Method and apparatus for color image processing, and a computer product
JP4423298B2 (ja) デジタル画像におけるテキスト状エッジの強調
US8144986B2 (en) Method and apparatus for binarization threshold calculation
WO2017121018A1 (zh) 二维码图像处理的方法和装置、终端、存储介质
US8331670B2 (en) Method of detection document alteration by comparing characters using shape features of characters
EP0712094A2 (en) A multi-windowing technique for threshholding an image using local image properties
JP2002133426A (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2000184202A (ja) 走査により生成した画像上における垂直方向に並んだパタ―ンを除去するための画像処理システム
CN113688838B (zh) 红色笔迹提取方法、系统、可读存储介质及计算机设备
US8442348B2 (en) Image noise reduction for digital images using Gaussian blurring
JP2004336282A (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP2001222683A (ja) 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体
JP3989647B2 (ja) 画像処理方法,装置および記録媒体
JP2871601B2 (ja) 文字列検出装置及び方法
JPH10285399A (ja) 画像の二値化方法
JP2000331118A (ja) 画像処理装置及び記録媒体
JPH10269352A (ja) 画像処理装置および方法
JP5098488B2 (ja) 画像処理装置
JPH0624014B2 (ja) 濃淡画像の処理方法
JP3358133B2 (ja) 画像処理装置
JP2000333022A (ja) 画像の二値化方法及び装置並びに記憶媒体
JP2006107018A (ja) 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム
KR100416496B1 (ko) 다중 역치값을 이용한 이치화 방법
JP4935561B2 (ja) 画像処理装置
KR100537829B1 (ko) 스캔 영상의 상역 분리 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040616

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20040618

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20061222

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070116

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070319

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070417

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070618

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20070717

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20070718

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100727

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110727

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120727

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130727

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees