JP2000293629A - 画像処理方法,装置および記録媒体 - Google Patents
画像処理方法,装置および記録媒体Info
- Publication number
- JP2000293629A JP2000293629A JP11102676A JP10267699A JP2000293629A JP 2000293629 A JP2000293629 A JP 2000293629A JP 11102676 A JP11102676 A JP 11102676A JP 10267699 A JP10267699 A JP 10267699A JP 2000293629 A JP2000293629 A JP 2000293629A
- Authority
- JP
- Japan
- Prior art keywords
- image
- binarization threshold
- value
- region
- area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Input (AREA)
- Facsimile Image Signal Circuits (AREA)
Abstract
単一領域内の一部にだけ網かけが施されている画像で
も、文字認識に好適な二値画像の生成を可能とする。 【解決手段】 濃淡画像から光学的文字認識に適した二
値画像を生成する際に、濃淡画像を入力(S11)、文
字認識の対象となる前記画像上の領域を特定し(S1
2)、各領域毎に二値化閾値を算出する(S13)。算
出された二値化閾値と領域内の各画素値との差の二乗平
均を計算し(S14)、その値が規定値以上の場合(S
15)、各文字領域内のエッジを数える(S17)。こ
のエッジの数から二値化状態を表す評価値を算出(S1
8)、前記評価値の値によっては二値化閾値を再設定し
(S20)、得られた二値化閾値(S22)により二値
画像を生成する(S23)。
Description
文字を光学的に認識する方法,装置に関し、濃淡画像か
ら文字が鮮明に再現された二値画像を生成し、文字認識
の精度向上を図る画像処理方法および装置に関する。
が提案されているが、そのほとんどが二値画像を対象と
したものであるので、二値画像の状態が認識精度を大き
く左右する。そのため、文字認識に好適な二値画像を生
成するために、多くの手法が提案されている。特開平1
0−143608号公報に記載の発明は、濃淡画像を適
当な閾値で二値化し、できた二値画像上の平均線幅を計
算し、その値が規定範囲外にある場合は、文字認識に不
適であると判断して二値化をやり直すことにより、文字
認識に好適な二値画像を生成することを目的としてい
る。
には、図6(A)に示すように、背景が複数の色で印刷
されているものが存在する。記入される文字は大抵明度
の低い色(黒,紺など)であるため、白でない背景は、
明度の高い色で印刷されており、そこに文字が記入され
た場合でも人間が見て見づらいということはない。以
下、このような領域を中間色領域と呼ぶことにする。と
ころが、この明度の高い色はほとんどの場合、比較的明
度の低い色のドットを非常に細かく印刷することで明度
の高い色を表現している。この中間色領域部分を二値化
した場合、図6(B)に示すように、二値化閾値によっ
ては数ドット程度の細かいノイズ(黒画素)が非常に多
く現われることがある。
を線幅判定に加えてしまうため、正しい閾値決定が難し
い。また、領域内に文字が全くない場合にも、ノイズを
手がかりに二値化閾値の決定を行うことになり、誤って
ノイズを文字画像として認識部に渡すことになりどちら
も誤認識の原因となる。よって、線幅に頼らず領域毎に
最適な二値化閾値を与えることと、文字がない領域では
認識部にノイズを渡さないことが必要となる。図6
(C)に、本発明による二値化の例を示す。
に、請求項1の発明は、濃淡画像から光学的文字認識に
適した二値画像を生成する方法であって、濃淡画像を入
力し、該画像上の文字認識の対象となる領域を特定し、
各領域毎に二値化閾値を算出し、この算出された二値化
閾値と領域内の各画素値との差の二乗平均を計算し、各
文字領域内のエッジを数え、このエッジの数から二値化
状態を表す評価値を算出し、この評価値の値によっては
二値化閾値を再設定し、得られた二値化閾値により二値
画像を生成することを特徴としている。
段と、文字認識の対象となる前記画像上の領域を特定す
る手段と、各領域毎に二値化閾値を算出する手段と、前
記算出された二値化閾値と領域内の各画素値との差の二
乗平均を計算する手段と、各文字領域内のエッジを数え
る手段と、前記エッジの数から二値化状態を表す評価値
を算出する手段と、前記評価値の値によっては二値化閾
値を再設定する手段と、得られた二値化閾値により二値
画像を生成する手段とを備えることを特徴としている。
能と、文字認識の対象となる前記画像上の領域を特定す
る機能と、各領域毎に二値化閾値を算出する機能と、前
記算出された二値化閾値と領域内の各画素値との差の二
乗平均を計算する機能と、各文字領域内のエッジを数え
る機能と、前記エッジ数から二値化状態を表す評価値を
算出する機能と、前記評価値の値によっては二値化閾値
を再設定する機能と、得られた二値化閾値により二値画
像を生成する機能とを備えることを特徴としている。
施例1を説明するための構成図で、図中、1は文字認識
を行いたい帳票原稿を濃淡画像として読み込む、スキャ
ナ等の濃淡画像入力手段、2は帳票上の文字の記入欄の
位置を特定する文字記入位置特定手段、3はある文字記
入欄の二値化閾値を決める二値化閾値算出手段、4は二
値化閾値算出手段3で計算された閾値と、領域内の画素
値の差の2乗平均値を求める、画素値差二乗平均値算出
手段、5は二値化閾値算出手段3で計算された閾値で二
値化した場合の、領域内の二値化状態を評価する値を計
算する、領域内二値化状態評価値算出手段、6は領域内
二値化状態評価値算出手段5で二値化状態が良くない場
合に二値化閾値を設定し直す二値化閾値再設定手段、7
は最終的に決定された閾値で二値画像を生成する二値画
像生成手段である。
明するためのフロー図で、まず、濃淡画像入力手段1を
用いて画像を入力する(S11)。次に、文字の記入位
置を文字記入位置特定手段2により特定する(S1
2)。これには様々な方法が考えられるが、特開平10
−91783号公報にあるように、未記入の同一フォー
マットの帳票画像との位置あわせを行い、この画像上の
位置座標値で定義された文字記入欄から処理対象の画像
上の文字記入欄の位置を推定する方法などを用いる。
算出手段3により、二値化閾値の算出を行う(S1
3)。ここでは判別分析法で閾値を決定する。判別分析
法とは、画像の濃度値ヒストグラムにおいて、濃度値の
集合を閾値tで2つのクラスに分割したときに、クラス
内の分散が最小、クラス間の分散が最小になるようなt
を閾値として決める方法である。
を1、t以上のクラスを2とおき、それぞれのクラス内
の分散をv1,v2、濃度平均値をe1,e2、画素数をn
1,n2とおいたとき、クラス内分散vcとクラス間分散
vbを vc(t)=n1v1+n2v2 vb(t)=n1n2(e1−e2)2 で定義する。このとき vb(t)/vc(t) が最大となるtを閾値とする。
に文字が記入された場合に加え、中間色領域に文字が記
入された場合にも背景を白、文字を黒としてきれいに二
値化が行える。ところが、領域内に文字が存在しない場
合、クラスの分割を強引に行うことになるので、できた
二値画像は白黒入り交じった画像になってしまう(図6
(B)参照)。この画像を認識部に渡すと文字の存在し
ない領域に対して文字があるとの認識結果を生みかねな
い。画素値差二乗平均値算出手段4により、文字の有無
を判定する(S14)。
素値をpi、画素総数をN、S13で求めた閾値をtと
すると
領域では値が小さくなる傾向がある。もちろん、網掛け
領域では一様濃度の領域よりは値は大きくなるが、それ
でも文字が記入された場合よりずっと小さな値をとる。
したがって、あらかじめ定めておいた値よりAvが小さ
い場合には(S15)、文字がないと判断できるので、
この領域は白画素で埋める二値化を行う(S16)。
領域内二値化状態評価値算出手段5により、領域内の二
値化状態を調べる。図3に示すように、領域内の一部分
だけに網がかかっている場合、判別分析法で二値化を行
うと網が二値画像として再現されてしまい、認識に悪い
影響を及ぼす。そこで、本実施例では画素の連結成分の
個数を用いて評価値を求める。
7)。エッジは、図4に示すように、領域内を横方向に
走査し、白黒が変動する回数を合計(図示例の場合、横
方向合計16)したあと、縦方向に走査して同様の操作
を行い(図示例の場合、縦方向合計20)、それらを合
計して求める(図示例の場合、領域内のエッジ数=16
+20=36)。
Rは、エッジ数をe、領域内の総画素数をNとおいて R=e2/N で計算する。Rは文字がない領域や、文字はあるものの
領域内の一部だけに網かけが施されている領域に判別分
析法で閾値を決定した場合に現われる、白黒入り交じっ
た二値画像に対しては値が大きくなる傾向がある。よっ
て、Rの大小で、二値化状態を判断できる。Rが、あら
かじめ定められた値よりも大きい場合は(S19)、二
値化状態が良くないと判断して、二値化閾値再設定手段
6により閾値を下げて(黒画素を減らすように変更し
て)、再度評価値を計算する(S20)。そうでない場
合は、この閾値による二値化状態が良好と判断し、二値
画像生成手段7により領域内を二値化する(S21)。
域全てに二値化処理を行うまで処理を繰り返し(S2
2)、終了したなら二値画像を出力して(S23)認識
部に渡し、処理を終了する。
構成を示す。本実施例は、請求項3の、ソフトウェアに
よって実現する場合の実施例であり、CPU11,メモ
リ12,ハードディスク13,入力装置14,CD−R
OMドライブ15,ディスプレイ16,マウスなどから
なる汎用の処理装置を用意する。CD−ROMなどの記
録媒体17には、本発明の二値画像生成の処理機能や処
理手順を実現させるためのプログラムが記録されてい
る。また、処理対象の原稿画像は、例えば、ハードディ
スク13などに格納されている。CPU11は、記録媒
体17から上記した処理機能,手順を実現するプログラ
ムを読み出し実行し、二値画像生成の結果をディスプレ
イ16などに出力する。
以下の効果が得られる。 1.領域ごとに背景色が異なる帳票に対しても、文字認
識に好適な二値画像の生成が可能である。 2.単一領域内の一部にだけ網かけが施されている画像
でも、文字認識に好適な二値画像生成が可能である。
ある。
のフロー図である。
を示す図である。
する場合の処理例を示す図である。
…二値化閾値算出手段、4…画素値差二乗平均値算出手
段、5…領域内二値化状態評価値算出手段、6…二値化
閾値再設定手段、7…二値画像生成手段、11…CP
U、12…メモリ、13…ハードディスク、14…入力
装置、15…CD−ROMドライブ、16…ディスプレ
イ、17…記録媒体。
Claims (3)
- 【請求項1】 濃淡画像から光学的文字認識に適した二
値画像を生成する方法であって、濃淡画像を入力し、該
濃淡画像上の文字認識の対象となる領域を特定し、各領
域毎に二値化閾値を算出し、この算出された二値化閾値
と領域内の各画素値との差の二乗平均を計算し、各文字
領域内のエッジの数を数え、このエッジの数から二値化
状態を表す評価値を算出し、この評価値の値によっては
二値化閾値を再設定し、得られた二値化閾値により二値
画像を生成することを特徴とする画像処理方法。 - 【請求項2】 濃淡画像から光学的文字認識に適した二
値画像を生成する装置であって、濃淡画像を入力する手
段と、該濃淡画像上の文字認識の対象となる領域を特定
する手段と、各領域毎に二値化閾値を算出する手段と、
前記算出された二値化閾値と領域内の各画素値との差の
二乗平均を計算する手段と、各文字領域内のエッジの数
を数える手段と、前記エッジの数から二値化状態を表す
評価値を算出する手段と、前記評価値の値によっては二
値化閾値を再設定する手段と、得られた二値化閾値によ
り二値画像を生成する手段とを備えることを特徴とする
画像処理装置。 - 【請求項3】 濃淡画像から光学的文字認識に適した二
値画像を生成する機能をコンピューターに実現させるプ
ログラムを格納した記録媒体であって、濃淡画像を入力
する機能と、文字認識の対象となる前記画像上の領域を
特定する機能と、各領域毎に二値化閾値を算出する機能
と、前記算出された二値化閾値と領域内の各画素値との
差の二乗平均を計算する機能と、各文字領域内のエッジ
を数える機能と、前記エッジ数から二値化状態を表す評
価値を算出する機能と、前記評価値の値によっては二値
化閾値を再設定する機能と、得られた二値化閾値により
二値画像を生成する機能とを備えることを特徴とする画
像処理方法を格納した、コンピューター読み取り可能な
記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10267699A JP3989647B2 (ja) | 1999-04-09 | 1999-04-09 | 画像処理方法,装置および記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP10267699A JP3989647B2 (ja) | 1999-04-09 | 1999-04-09 | 画像処理方法,装置および記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2000293629A true JP2000293629A (ja) | 2000-10-20 |
JP3989647B2 JP3989647B2 (ja) | 2007-10-10 |
Family
ID=14333847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP10267699A Expired - Fee Related JP3989647B2 (ja) | 1999-04-09 | 1999-04-09 | 画像処理方法,装置および記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3989647B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156868A (zh) * | 2011-03-31 | 2011-08-17 | 汉王科技股份有限公司 | 图像二值化方法和装置 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109615880B (zh) * | 2018-10-29 | 2020-10-23 | 浙江浙大列车智能化工程技术研究中心有限公司 | 一种基于雷达图像处理的车流量测量方法 |
-
1999
- 1999-04-09 JP JP10267699A patent/JP3989647B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102156868A (zh) * | 2011-03-31 | 2011-08-17 | 汉王科技股份有限公司 | 图像二值化方法和装置 |
CN102156868B (zh) * | 2011-03-31 | 2013-03-13 | 汉王科技股份有限公司 | 图像二值化方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
JP3989647B2 (ja) | 2007-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7292375B2 (en) | Method and apparatus for color image processing, and a computer product | |
JP4423298B2 (ja) | デジタル画像におけるテキスト状エッジの強調 | |
US8144986B2 (en) | Method and apparatus for binarization threshold calculation | |
WO2017121018A1 (zh) | 二维码图像处理的方法和装置、终端、存储介质 | |
US8331670B2 (en) | Method of detection document alteration by comparing characters using shape features of characters | |
EP0712094A2 (en) | A multi-windowing technique for threshholding an image using local image properties | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP2000184202A (ja) | 走査により生成した画像上における垂直方向に並んだパタ―ンを除去するための画像処理システム | |
CN113688838B (zh) | 红色笔迹提取方法、系统、可读存储介质及计算机设备 | |
US8442348B2 (en) | Image noise reduction for digital images using Gaussian blurring | |
JP2004336282A (ja) | 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体 | |
JP2001222683A (ja) | 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体 | |
JP3989647B2 (ja) | 画像処理方法,装置および記録媒体 | |
JP2871601B2 (ja) | 文字列検出装置及び方法 | |
JPH10285399A (ja) | 画像の二値化方法 | |
JP2000331118A (ja) | 画像処理装置及び記録媒体 | |
JPH10269352A (ja) | 画像処理装置および方法 | |
JP5098488B2 (ja) | 画像処理装置 | |
JPH0624014B2 (ja) | 濃淡画像の処理方法 | |
JP3358133B2 (ja) | 画像処理装置 | |
JP2000333022A (ja) | 画像の二値化方法及び装置並びに記憶媒体 | |
JP2006107018A (ja) | 画像解析方法及び装置、画像処理方法及びシステム、これらの動作プログラム | |
KR100416496B1 (ko) | 다중 역치값을 이용한 이치화 방법 | |
JP4935561B2 (ja) | 画像処理装置 | |
KR100537829B1 (ko) | 스캔 영상의 상역 분리 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040616 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20040618 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20061222 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070116 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070319 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070417 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070618 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070717 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070718 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100727 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110727 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120727 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120727 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130727 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |