JPH02231690A - 線画像認識方法 - Google Patents
線画像認識方法Info
- Publication number
- JPH02231690A JPH02231690A JP1052550A JP5255089A JPH02231690A JP H02231690 A JPH02231690 A JP H02231690A JP 1052550 A JP1052550 A JP 1052550A JP 5255089 A JP5255089 A JP 5255089A JP H02231690 A JPH02231690 A JP H02231690A
- Authority
- JP
- Japan
- Prior art keywords
- line
- area
- line image
- picture
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000010586 diagram Methods 0.000 description 5
- 239000000470 constituent Substances 0.000 description 1
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
[産業上の利用分野]
本発明は、線画像認識方法に関し、さらに詳細には、か
すれ等のある文字等をノイズを避けながら修正して認識
する線画像認識方法に関するものである。
すれ等のある文字等をノイズを避けながら修正して認識
する線画像認識方法に関するものである。
[従来技術]
従来、文字認識装置として原稿上の文字をスキャナ等で
読取り、その読取られた文字のデータをピクセル毎に2
値化する。そしてこの2値化されたデータを基に認識を
行っていた。しかしながらこのような2値化されたデー
タは、ノイズ,かすれ等により本来は繋がっている線が
途切れる等の問題があり、認識率の向上が望めなかった
。
読取り、その読取られた文字のデータをピクセル毎に2
値化する。そしてこの2値化されたデータを基に認識を
行っていた。しかしながらこのような2値化されたデー
タは、ノイズ,かすれ等により本来は繋がっている線が
途切れる等の問題があり、認識率の向上が望めなかった
。
そこで、従来の装置では、ピクセル配列における“黒゜
に2値化された領域の周囲を縦横共に1ドットずつ広げ
、線中の穴や途切れを修復する。
に2値化された領域の周囲を縦横共に1ドットずつ広げ
、線中の穴や途切れを修復する。
この処理を複数回行うことにより、読取られた文字のデ
ータを完全に修復した後、公知の細線化技術により細線
化する。この細線化によって、前述の処理によって太っ
た線は再び細線化される。しかし1ドットの太さの線は
それ以上細線化(消去)されることはない。そのため、
この2行程の処理により、かすれ等のなくなったデータ
によって認識を行っていた。
ータを完全に修復した後、公知の細線化技術により細線
化する。この細線化によって、前述の処理によって太っ
た線は再び細線化される。しかし1ドットの太さの線は
それ以上細線化(消去)されることはない。そのため、
この2行程の処理により、かすれ等のなくなったデータ
によって認識を行っていた。
[発明が解決しようとする課題]
しかしながら、この方法では、“黒”に2値化されるは
ずであったデータが広範囲にわたりかすれ等で欠落して
いる場合では、修正不可能であった。また無理に修正し
ようとした場合には、この処理により認識に必要な情報
成分についても消去してしまう場合があった。
ずであったデータが広範囲にわたりかすれ等で欠落して
いる場合では、修正不可能であった。また無理に修正し
ようとした場合には、この処理により認識に必要な情報
成分についても消去してしまう場合があった。
また、かすれ等による欠落を防ぐためにスレッシュホー
ルドを下げた場合、ノイズ等を拾いやすくなり、この場
合においても認識率の向上は望めなかった。
ルドを下げた場合、ノイズ等を拾いやすくなり、この場
合においても認識率の向上は望めなかった。
本発明は、上述した問題点を解決するためになされたも
のであり、かすれのある文字等をノイズを拾うことなし
に修正することにより、高認識率を実現する線画像認識
方法を提供することを目的とする。
のであり、かすれのある文字等をノイズを拾うことなし
に修正することにより、高認識率を実現する線画像認識
方法を提供することを目的とする。
[課題を解決するための手段]
上記目的を達成するために本発明は原稿画像を各ピクセ
ル毎に数値化し、その数値に応じて、線画像を構成する
可能性の高いピクセルにより構成される第1領域と、線
画像を構成する可能性の低いピクセルより構成される第
2領域と、前記第1領域及び第2領域に属さないピクセ
ルにより構成される第3領域とに分割し、前記第1領域
の中心線を抽出した第1線画像を抽出し、前記第3領域
の中心線を抽出した第2線画像を抽出し、前記第2線画
像における前記第1線画像を連続する線のみを該第1線
画像に重ねてできる線画像を認識することを特徴とする
。
ル毎に数値化し、その数値に応じて、線画像を構成する
可能性の高いピクセルにより構成される第1領域と、線
画像を構成する可能性の低いピクセルより構成される第
2領域と、前記第1領域及び第2領域に属さないピクセ
ルにより構成される第3領域とに分割し、前記第1領域
の中心線を抽出した第1線画像を抽出し、前記第3領域
の中心線を抽出した第2線画像を抽出し、前記第2線画
像における前記第1線画像を連続する線のみを該第1線
画像に重ねてできる線画像を認識することを特徴とする
。
[作用]
上記の構成を有する本発明の方法において、原稿画像は
、その各ピクセルからの光の輝度等により、各ピクセル
毎に数値化される。そしてこの数値により、原稿画像は
第1領域乃至第3領域に分割する。この3つの領域のう
ち、第1領域は線画像を構成する可能性が極めて高く、
第3領域はその可能性が中程度である。従って、第1領
域と、第3領域の一部を重ねたものが認識対象であると
考えられる。そこで、細線化等の手法で得られる第1領
域及び第3領域の中心線で構成される第1線画像及び第
2線画像を重ね合わせる。そして第2線画像における第
1線画像に対して連続性のあるものを線画像の構成部分
であるものとし、他の第2線画像の部分を削除した画像
を想定する。そしてその想定された線画像を認識する。
、その各ピクセルからの光の輝度等により、各ピクセル
毎に数値化される。そしてこの数値により、原稿画像は
第1領域乃至第3領域に分割する。この3つの領域のう
ち、第1領域は線画像を構成する可能性が極めて高く、
第3領域はその可能性が中程度である。従って、第1領
域と、第3領域の一部を重ねたものが認識対象であると
考えられる。そこで、細線化等の手法で得られる第1領
域及び第3領域の中心線で構成される第1線画像及び第
2線画像を重ね合わせる。そして第2線画像における第
1線画像に対して連続性のあるものを線画像の構成部分
であるものとし、他の第2線画像の部分を削除した画像
を想定する。そしてその想定された線画像を認識する。
[実施例]
以下、本発明を具体化したー実施例を図面を参照して説
明する。
明する。
まず、本方法を利用する文字認識装置について第2図を
参照して説明する。原稿画像を読取るための公知のスキ
ャナ1は、原稿画像の各ピクセルのデータを8bitで
量子化して出力する。このスキャナ1には認識装置本体
2が接続されており、前記スキャナ1より出力される信
号は本体2における入力インターフェイス21を介して
プロセッサ22に入力されている。このプロセッサ22
にはランダムアクセスメモリ(RAM)23及びリード
オンメモリ(ROM)24が接続されている。
参照して説明する。原稿画像を読取るための公知のスキ
ャナ1は、原稿画像の各ピクセルのデータを8bitで
量子化して出力する。このスキャナ1には認識装置本体
2が接続されており、前記スキャナ1より出力される信
号は本体2における入力インターフェイス21を介して
プロセッサ22に入力されている。このプロセッサ22
にはランダムアクセスメモリ(RAM)23及びリード
オンメモリ(ROM)24が接続されている。
このROM24には前記プロセッサを作用させるプログ
ラム及び後述する第1の閾値及び第2の閾値等の各種定
数及び認識に必要なデータが記憶されている。また前記
RAM23には、スキャナ1より読取られた多値画像を
記憶する原画像記憶領域、同一サイズの2値画像を記憶
する2つの記憶領域(以下それぞれ2値画像記憶領域及
び中間調部記憶領域と称す)を有している。前記認識装
置本体2には、ディスプレイ3及びプリンタ4が取付け
られ、前記CPU22は出力インターフエイス25を介
してそれらに文字コード等を出力可能である。
ラム及び後述する第1の閾値及び第2の閾値等の各種定
数及び認識に必要なデータが記憶されている。また前記
RAM23には、スキャナ1より読取られた多値画像を
記憶する原画像記憶領域、同一サイズの2値画像を記憶
する2つの記憶領域(以下それぞれ2値画像記憶領域及
び中間調部記憶領域と称す)を有している。前記認識装
置本体2には、ディスプレイ3及びプリンタ4が取付け
られ、前記CPU22は出力インターフエイス25を介
してそれらに文字コード等を出力可能である。
次に以上の様に構成された本装置の作用を第3図を参照
して説明する。第3図は前記プロセッサ22の作用を示
すフローチャートである。まず本装置は、ステップS3
1において前記スキャナ1より原稿画像のデータを読取
る。この原稿画像は、白の地色上の原稿の紙に黒色の文
字が書かれたちのでる。また前記データは、この原稿画
像を多数のピクセルに分割し、各ピクセル毎にその反射
光の輝度を離散数値化したものである。CPU22は、
このデータを入力し、前記RAM23の原画像記憶領域
に記憶される。
して説明する。第3図は前記プロセッサ22の作用を示
すフローチャートである。まず本装置は、ステップS3
1において前記スキャナ1より原稿画像のデータを読取
る。この原稿画像は、白の地色上の原稿の紙に黒色の文
字が書かれたちのでる。また前記データは、この原稿画
像を多数のピクセルに分割し、各ピクセル毎にその反射
光の輝度を離散数値化したものである。CPU22は、
このデータを入力し、前記RAM23の原画像記憶領域
に記憶される。
次にステップS32において、CPU22はこのRAM
23の原画像記憶領域に記憶されるデータを第1の閾値
と比較し、その比較結果を基に2値画像を作成する。こ
の作成画像は2値画像記憶領域に記憶される。この第1
の閾値は、原稿画像における黒色部と略断定できる上限
値を選ぶ。例えば、この第1の閾値として第4図に示す
様な標準的な原稿画像データのヒストグラムにおける黒
色側の極大値点(図中の(イ))と極大値に挾まれた極
小値(図中の(口))との中間値の位置41等を選ぶ。
23の原画像記憶領域に記憶されるデータを第1の閾値
と比較し、その比較結果を基に2値画像を作成する。こ
の作成画像は2値画像記憶領域に記憶される。この第1
の閾値は、原稿画像における黒色部と略断定できる上限
値を選ぶ。例えば、この第1の閾値として第4図に示す
様な標準的な原稿画像データのヒストグラムにおける黒
色側の極大値点(図中の(イ))と極大値に挾まれた極
小値(図中の(口))との中間値の位置41等を選ぶ。
尚、以後、このステップの処理により黒色側に二値化さ
れた原画像の領域を線画像領域と呼ぶ。
れた原画像の領域を線画像領域と呼ぶ。
次にステップ33において、CPU22は前記線画像領
域以外の領域に対し、各データを第2の閾値として比較
する。そして前記第1の閾値と第2の閾値との間の領域
を選出して、前記中間調部記憶領域に記憶する。この第
2の閾値としては、例えば図4のヒストグラムにおける
白側の極大値(図中の(ハ))及び前記極小値との中間
値の位置42を選ぶ。このステップの処理により抽出さ
れた前記第1の閾値と前記第2の閾値とに挾まれる領域
を中間調領域と呼ぶ。この中間調領域は、主に原稿画像
のかすれやノイズ等が含まれている。
域以外の領域に対し、各データを第2の閾値として比較
する。そして前記第1の閾値と第2の閾値との間の領域
を選出して、前記中間調部記憶領域に記憶する。この第
2の閾値としては、例えば図4のヒストグラムにおける
白側の極大値(図中の(ハ))及び前記極小値との中間
値の位置42を選ぶ。このステップの処理により抽出さ
れた前記第1の閾値と前記第2の閾値とに挾まれる領域
を中間調領域と呼ぶ。この中間調領域は、主に原稿画像
のかすれやノイズ等が含まれている。
尚、線画像領域は本発明の第1領域に、中間調領域は本
発明の第3領域に対応している。線画像領域にも、中間
調領域にも含まれない領域は本発明における第3領域に
対応している。次にステッブS34において、前記線画
像領域及び中間調領域の細線化を行う。この細線化の処
理としては、「細線化マスクパターンによる逐次細線化
」や「内接円による方法j等が公知であるので、ここで
はそのプロセスは詳述しない。この処理により、太い線
は細線化されるが、細い線(幅1ピクセル)については
そのまま保存される。
発明の第3領域に対応している。線画像領域にも、中間
調領域にも含まれない領域は本発明における第3領域に
対応している。次にステッブS34において、前記線画
像領域及び中間調領域の細線化を行う。この細線化の処
理としては、「細線化マスクパターンによる逐次細線化
」や「内接円による方法j等が公知であるので、ここで
はそのプロセスは詳述しない。この処理により、太い線
は細線化されるが、細い線(幅1ピクセル)については
そのまま保存される。
次にステップS35において、前記細線画像領域を細線
化した線画像と前記中間調領域を細線化した線画像との
ずれを計算する。この計算方法としては、各線図形の最
も近い端点の距離等が利用できる。また後述する方法も
利用できる。次にステップS36において、前記線画像
領域を細線化した線画像に前記中間調領域を細線化した
画像より前記ステップS35において計算されたずれの
小さいものを重ね合わせる。そして多連続性のある線画
像の端点を連結する。そしてこの線画像を前記2値画像
記憶領域に記憶させる。
化した線画像と前記中間調領域を細線化した線画像との
ずれを計算する。この計算方法としては、各線図形の最
も近い端点の距離等が利用できる。また後述する方法も
利用できる。次にステップS36において、前記線画像
領域を細線化した線画像に前記中間調領域を細線化した
画像より前記ステップS35において計算されたずれの
小さいものを重ね合わせる。そして多連続性のある線画
像の端点を連結する。そしてこの線画像を前記2値画像
記憶領域に記憶させる。
次にステップS37において、この2値画像記憶領域に
記憶される線画像を公知のテンプレートマッチング法等
の手法により認識する。
記憶される線画像を公知のテンプレートマッチング法等
の手法により認識する。
そしてステップS3gにおいて、この認識結果を出力す
る。この出力される認識された文字は前記ディスプレイ
3あるいはプリンタ4により表示される。
る。この出力される認識された文字は前記ディスプレイ
3あるいはプリンタ4により表示される。
次に第1図を参照して、実際に認識が行われるまでの動
作を説明する。原稿上に同図の(a)に示す様な原稿画
像が書込まれていたとする。ここで斜線を付して示す領
域は、インクのかすれ、ノイズ等により黒色とも地色(
白色)とも判断できない部分である。このような画像が
スキャナ1より入力されると(S31)、同図の(b)
に示す様な線画像領域及び同図(c)に示すような中間
調領域に分割される(S32,833)。これらの各領
域は、同図の(d)の実線及び(e)の破線によって示
される線に細線化される(S34)。
作を説明する。原稿上に同図の(a)に示す様な原稿画
像が書込まれていたとする。ここで斜線を付して示す領
域は、インクのかすれ、ノイズ等により黒色とも地色(
白色)とも判断できない部分である。このような画像が
スキャナ1より入力されると(S31)、同図の(b)
に示す様な線画像領域及び同図(c)に示すような中間
調領域に分割される(S32,833)。これらの各領
域は、同図の(d)の実線及び(e)の破線によって示
される線に細線化される(S34)。
この後これらを重ねた同図(f)において示すような図
において実線部と連続性のある破線部を抽出し(S35
、S36)、同図の(g)のようにその抽出された部分
と前記線画像領域とを重ねる。
において実線部と連続性のある破線部を抽出し(S35
、S36)、同図の(g)のようにその抽出された部分
と前記線画像領域とを重ねる。
そしてその重ねられた図形を認識する。
尚、本発明の主旨に反しない限り、種々の応用は可能で
ある。例えば前記ステップS35及びS36は次のよう
な処理に置換えることができる。
ある。例えば前記ステップS35及びS36は次のよう
な処理に置換えることができる。
第5図で(a)はすでに前述の細線化が出来ているもの
であり、実線は第1領域を細線化したもの、点線は中間
調領域を細線化したものである。まず、細線化された中
間調領域で実線部分と内積を計算する事により方向が一
致するものを選ぶ。すると(a)の(イ)の部分が除外
され、(口),(ハ)の部分が残り、(b)の様になる
。次に残った中間調領域の部分で端点が実線部分の端点
近くにあるものを選ぶ。すると(口)の部分が除外され
、(c)の様により、点線部分も実線に変え、(d)の
様にして、文字又は図形を認識する。
であり、実線は第1領域を細線化したもの、点線は中間
調領域を細線化したものである。まず、細線化された中
間調領域で実線部分と内積を計算する事により方向が一
致するものを選ぶ。すると(a)の(イ)の部分が除外
され、(口),(ハ)の部分が残り、(b)の様になる
。次に残った中間調領域の部分で端点が実線部分の端点
近くにあるものを選ぶ。すると(口)の部分が除外され
、(c)の様により、点線部分も実線に変え、(d)の
様にして、文字又は図形を認識する。
[発明の効果]
以上詳述したことから明らかなように、本発明によれば
、ノイズ,かすれ等により不鮮明な部分を、線の連続性
を用いて情報を有する部分と、そうでない部分とに分け
て利用しているので、ノイズ等を有する線画像に対し、
一段の認識率の向上を期待することができる。
、ノイズ,かすれ等により不鮮明な部分を、線の連続性
を用いて情報を有する部分と、そうでない部分とに分け
て利用しているので、ノイズ等を有する線画像に対し、
一段の認識率の向上を期待することができる。
第1図から第5図までは本発明を具体化した実施例を示
すもので、第1図は本装置の基本的動作を説明する図、
第2図は本装置の基本的構成を示す図、第3図は処理の
流れを示すフローチャートを示す図、第4図は領域を分
ける閾値を決める方法を説明する図、第5図は異なる領
域間での連続性を調べる方法を説明する図である。 図中、2はコンピュータ、41は第1閾値、42は第2
閾値である。
すもので、第1図は本装置の基本的動作を説明する図、
第2図は本装置の基本的構成を示す図、第3図は処理の
流れを示すフローチャートを示す図、第4図は領域を分
ける閾値を決める方法を説明する図、第5図は異なる領
域間での連続性を調べる方法を説明する図である。 図中、2はコンピュータ、41は第1閾値、42は第2
閾値である。
Claims (1)
- 【特許請求の範囲】 1、原稿画像を各ピクセル毎に数値化し、その数値に応
じて、線画像を構成する可能性の高いピクセルにより構
成される第1領域と、線画像を構成する可能性の低いピ
クセルより構成される第2領域と、前記第1領域及び第
2領域に属さないピクセルにより構成される第3領域と
に分割し、前記第1領域の中心線を抽出した第1線画像
を抽出し、前記第3領域の中心線を抽出した第2線画像
を抽出し、前記第2線画像における前記第1線画像を連
続する線のみを該第1線画像に重ねてできる線画像を認
識することを特徴とする線画像認識方法。 2、請求項1記載の線画像認識方法において、原稿画像
をピクセル毎の離散値によるデータに変換し、該変換さ
れたデータを第1閾値及び該第1閾値と異なる第2閾値
と比較し、その大小関係に応じて前記第1領域乃至第3
領域を決定することを特徴とする線画像認識方法。 3、請求項1あるいは2記載の線画像認識方法において
、前記第1領域及び前記第3領域の中心線の抽出は、該
領域の細線化によってなされることを特徴とする線画像
認識方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1052550A JP2789647B2 (ja) | 1989-03-03 | 1989-03-03 | 線画像認識方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP1052550A JP2789647B2 (ja) | 1989-03-03 | 1989-03-03 | 線画像認識方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH02231690A true JPH02231690A (ja) | 1990-09-13 |
JP2789647B2 JP2789647B2 (ja) | 1998-08-20 |
Family
ID=12917910
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP1052550A Expired - Lifetime JP2789647B2 (ja) | 1989-03-03 | 1989-03-03 | 線画像認識方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2789647B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859929A (en) * | 1995-12-01 | 1999-01-12 | United Parcel Service Of America, Inc. | System for character preserving guidelines removal in optically scanned text |
-
1989
- 1989-03-03 JP JP1052550A patent/JP2789647B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5859929A (en) * | 1995-12-01 | 1999-01-12 | United Parcel Service Of America, Inc. | System for character preserving guidelines removal in optically scanned text |
Also Published As
Publication number | Publication date |
---|---|
JP2789647B2 (ja) | 1998-08-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6389163B1 (en) | Method and apparatus for automatic image segmentation using template matching filters | |
US7411699B2 (en) | Method and apparatus to enhance digital image quality | |
CN102722729A (zh) | 通过用字符的形状特征来比较字符而检测文档变化的方法 | |
US8229214B2 (en) | Image processing apparatus and image processing method | |
CN110210467B (zh) | 一种文本图像的公式定位方法、图像处理装置、存储介质 | |
CN114519788A (zh) | 图像处理方法、装置、电子设备及计算机可读存储介质 | |
US6983077B2 (en) | Image processor | |
JPH02231690A (ja) | 線画像認識方法 | |
JPH08237404A (ja) | 光学文字認識モードの選択方法 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JPH05128306A (ja) | 文章画像の属性判別方法 | |
JP6797763B2 (ja) | 文字認識装置 | |
JPS6331825B2 (ja) | ||
JPH06274691A (ja) | 文字認識装置 | |
JP3162414B2 (ja) | 罫線認識方法及び表処理方法 | |
JP2613211B2 (ja) | 画像入力装置 | |
JP2000148908A (ja) | 文書画像処理方法、装置および記録媒体 | |
JP3210224B2 (ja) | 文字認識装置 | |
JP2001143076A (ja) | 画像処理装置 | |
JPH0660220A (ja) | 文書画像の領域抽出方法 | |
JPH0520455A (ja) | 画像処理方法 | |
JP2853141B2 (ja) | 画像領域識別装置 | |
JP2899356B2 (ja) | 文字認識装置 | |
JPH05282489A (ja) | 文章画像の属性判別方法 | |
JPH11232463A (ja) | 画像認識装置および方法 |