JP2789647B2 - 線画像認識方法 - Google Patents

線画像認識方法

Info

Publication number
JP2789647B2
JP2789647B2 JP1052550A JP5255089A JP2789647B2 JP 2789647 B2 JP2789647 B2 JP 2789647B2 JP 1052550 A JP1052550 A JP 1052550A JP 5255089 A JP5255089 A JP 5255089A JP 2789647 B2 JP2789647 B2 JP 2789647B2
Authority
JP
Japan
Prior art keywords
line image
line
area
image
region
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP1052550A
Other languages
English (en)
Other versions
JPH02231690A (ja
Inventor
史朗 浅野
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Brother Industries Ltd
Original Assignee
Brother Industries Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Brother Industries Ltd filed Critical Brother Industries Ltd
Priority to JP1052550A priority Critical patent/JP2789647B2/ja
Publication of JPH02231690A publication Critical patent/JPH02231690A/ja
Application granted granted Critical
Publication of JP2789647B2 publication Critical patent/JP2789647B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、線画像認識方法に関し、さらに詳細には、
かすれ等のある文字等をノイズを避けながら修正して認
識する線画像認識方法に関するものである。
[従来技術] 従来、文字認識装置として原稿上の文字をスキャナ等
で読取り、その読取られた文字のデータをピクセル毎に
2値化する。そしてこの2値化されたデータを基に認識
を行っていた。しかしながらこのような2値化されたデ
ータは、ノイズ,かすれ等により本来は繋がっている線
が途切れる等の問題があり、認識率の向上が望めなかっ
た。
そこで、従来の装置では、ピクセル配列における
“黒”に2値化された領域の周囲を縦横共に1ドットず
つ広げ、線中の穴や途切れを修復する。この処理を複数
回行うことにより、読取られた文字のデータを完全に修
復した後、公知の細線化技術により細線化する。この細
線化によって、前述の処理によって太った線は再び細線
化される。しかし1ドットの太さの線はそれ以上細線化
(消去)されることはない。そのため、この2行程の処
理により、かすれ等のなくなったデータによって認識を
行っていた。
[発明が解決しようとする課題] しかしながら、この方法では、“黒”に2値化される
はずであったデータが広範囲にわたりかすれ等で欠落し
ている場合では、修正不可能であった。また無理に修正
しようとした場合には、この処理により認識に必要な情
報成分についても消去してしまう場合があった。
また、かすれ等による欠落を防ぐためにスレッシュホ
ールドを下げた場合、ノイズ等を拾いやすくなり、この
場合においても認識率の向上は望めなかった。
本発明は、上述した問題点を解決するためになされた
ものであり、かすれのある文字等をノイズを拾うことな
しに修正することにより、高認識率を実現する線画像認
識方法を提供することを目的とする。
[課題を解決するための手段] 上記目的を達成するために本発明は原稿画像を各ピク
セル毎に数値化し、その数値に応じて、線画像を構成す
る可能性の高いピクセルにより構成される第1領域と、
線画像を構成する可能性の低いピクセルより構成される
第2領域と、前記第1領域及び第2領域に属さないピク
セルにより構成される第3領域とに分割し、前記第1領
域の中心線を抽出した第1線画像を抽出し、前記第3領
域の中心線を抽出した第2線画像を抽出し、前記第2線
画像における前記第1線画像を連続する線のみを該第1
線画像に重ねてできる線画像を認識することを特徴とす
る。
[作用] 上記の構成を有する本発明の方法において、原稿材料
は、その各ピクセルからの光の輝度等により、各ピクセ
ル毎に数値化される。そしてこの数値により、原稿画像
は第1領域乃至第3領域に分割する。この3つの領域の
うち、第1領域は線画像を構成する可能性が極めて高
く、第3領域はその可能性が中程度である。従って、第
1領域と、第3領域の一部を重ねたものが認識対象であ
ると考えられる。そこで、細線化等の手法で得られる第
1領域及び第3領域の中心線で構成される第1線画像及
び第2線画像を重ね合わせる。そして第2線画像におけ
る第1線画像に対して連続性のあるものを線画像の構成
部分であるものとし、他の第2線画像の部分を削除した
画像を想定する。そしてその想定された線画像を認識す
る。
[実施例] 以下、本発明を具体化した一実施例を図面を参照して
説明する。
まず、本方法を利用する文字認識装置について第2図
を参照して説明する。原稿画像を読取るための公知のス
キャナ1は、原稿画像の各ピクセルのデータを8bitで量
子化して出力する。このスキャナ1には認識装置本体2
が接続されており、前記スキャナ1より出力される信号
は本体2における入力インターフェイス21を介してプロ
セッサ22に入力されている。このプロセッサ22にはラン
ダムアクセスメモリ(RAM)23及びリードオンメモリ(R
OM)24が接続されている。このROM24には前記プロセッ
サを作用させるプログラム及び後述する第1の閾値及び
第2の閾値等の各種定数及び認識に必要なデータが記憶
されている。また前記RAM23には、スキャナ1より読取
られた多値画像を記憶する原画像記憶領域、同一サイズ
の2値画像を記憶する2つの記憶領域(以下それぞれ2
値画像記憶領域及び中間調部記憶領域と称す)を有して
いる。前記認識装置本体2には、ディスプレイ3及びプ
リンタ4が取付けられ、前記CPU22は出力インターフェ
イス25を介してそれらに文字コード等を出力可能であ
る。
次に以上の様に構成された本装置の作用を第3図を参
照して設明する。第3図は前記プロセッサ22の作用を示
すフローチャートである。まず本装置は、ステップS31
において前記スキャナ1より原稿画像のデータを読取
る。この原稿画像は、白の地色上の原稿の紙に黒色の文
字が書かれたものでる。また前記データは、この原稿画
像を多数のピクセルに分割し、各ピクセル毎にその反射
光の輝度を離散数値化したものである。CPU22は、この
データを入力し、前記RAM23の原画像記憶領域に記憶さ
れる。
次にステップS32において、CPU22はこのRAM23の原画
像記憶領域に記憶されるデータを第1の閾値と比較し、
その比較結果を基に2値画像を作成する。この作成画像
は2値画像記憶領域に記憶される、この第1の閾値は、
原稿画像における黒色部と略断定できる上限値を選ぶ。
例えば、この第1の閾値として第4図に示す様な標準的
な原稿画像データのヒストグラムにおける黒色側の極大
値点(図中の(イ))と極大値に挾まれた極小値(図中
の(ロ))との中間値の位置41等を選ぶ。尚、以後、こ
のステップの処理により黒色側に二値化された原画像の
領域を線画像領域と呼ぶ。
次にステップ33において、CPU22は前記線画像領域以
外の領域に対し、各データを第2の閾値として比較す
る。そして前記第1の閾値と第2の閾値との間の領域を
選出して、前記中間調部記憶領域に記憶する。この第2
の閾値としては、例えば図4のヒストグラムにおける白
側の極大値(図中の(ハ))及び前記極小値との中間値
の位置42を選ぶ。このステップの処理により抽出された
前記第1の閾値と前記第2の閾値とに挾まれる領域を中
間調領域と呼ぶ。この中間調領域は、主に原稿画像のか
すれやノイズ等が含まれている。
尚、線画像領域は本発明の第1領域に、中間調領域は
本発明の第3領域に対応している。線画像領域にも、中
間調領域にも含まれない領域は本発明における第3領域
に対応している。次にステップS34において、前記線画
像領域及び中間調領域の細線化を行う。この細線化の処
理としては、「細線化マスクパターンによる逐次細線
化」や「内接円による方法」等が公知であるので、ここ
ではそのプロセスは詳述しない。この処理により、太い
線は細線化されるが、細い線(幅1ピクセル)について
はそのまま保存される。
次にステップS35において、前記細線画像領域を細線
化した線画像と前記中間調領域を細線化した線画像との
ずれを計算する。この計算方法としては、各線図形の最
も近い端点の距離等が利用できる。また後述する方法も
利用できる。次にステップS36において、前記線画像領
域を細線化した線画像に前記中間調領域を細線化した画
像より前記ステップS35において計算されたずれの小さ
いものを重ね合わせる。そして多連続性のある線画像の
端点を連結する。そしてこの線画像を前記2値画像記憶
領域に記憶させる。
次にステップS37において、この2値画像記憶領域に
記憶される線画像を公知のテンプレートマッチング法等
の手法により認識する。
そしてステップS38において、この認識結果は出力す
る。この出力される認識された文字は前記ディスプレイ
3あるいはプリンタ4により表示される。
次に第1図を参照して、実際に認識が行われるまでの
動作を設明する。原稿上に同図(a)に示す様な原稿画
像が書込まれていたとする。ここで斜線を付して示す領
域は、インクのかすれ、ノイズ等により黒色とも地色
(白色)とも判断できない部分である。このような画像
がスキャナ1より入力されると(S31)、同図の(b)
に示す様な線画像領域及び同図(c)に示すような中間
調領域に分割される。(S32,S33)。これらの各領域
は、同図の(d)の実線及び(e)の破線によって示さ
れる線に細線化される。(S34)。この後これらを重ね
た同図(f)において示すような図において実線部と連
続性のある破線部を抽出し(S35,S36)、同図の(g)
のようにその抽出された部分と前記線画像領域とを重ね
る。そしてその重ねられた図形を認識する。
尚、本発明の主旨に反しない限り、種々の応用は可能
である。例えば前記ステップS35及びS36は次のような処
理に置換えることができる。第5図で(a)はすでに前
述の細線化が出来ているものであり、実線は第1領域を
細線化したもの、点線は中間調領域を細線化したもので
ある。まず、細線化された中間調領域で実線部分と内積
を計算する事により方向が一致するものを選ぶ。すると
(a)の(イ)の部分が除外され、(ロ),(ハ)の部
分が残り、(b)の様になる。次に残った中間調領域の
部分で端点が実線部分の端点近くにあるものを選ぶ。す
ると(ロ)の部分が除外され、(c)の様により、点線
部分も実線に変え、(d)の様にして、文字又は図形を
認識する。
[発明の効果] 以上詳述したことから明らかなように、本発明によれ
ば、ノイズ,かすれ等により不鮮明な部分を、線の連続
性を用いて情報を有する部分と、そうでない部分とに分
けて利用しているので、ノイズ等を有る線画像に対し、
一段の認識率の向上を期待することができる。
【図面の簡単な説明】
第1図から第5図までは本発明を具体化した実施例を示
すもので、第1図は本装置の基本的動作を説明する図、
第2図は本装置の基本的構成を示す図、第3図は処理の
流れを示すフローチャートを示す図、第4図は領域を分
ける閾値を決める方法を説明する図、第5図は異なる領
域間での連続性を調べる方法を説明する図である。 図中、2はコンピュータ、41は第1閾値、42は第2閾値
である。

Claims (3)

    (57)【特許請求の範囲】
  1. 【請求項1】原稿画像を各ピクセル毎に数値化し、その
    数値に応じて、線画像を構成する可能性の高いピクセル
    により構成される第1領域と、線画像を構成する可能性
    の低いピクセルより構成される第2領域と、前記第1領
    域及び第2領域に属さないピクセルにより構成される第
    3領域とに分割し、前記第1領域の中心線を抽出した第
    1線画像を抽出し、前記第3領域の中心線を抽出した第
    2線画像を抽出し、前記第2線画像における前記第1線
    画像を連続する線のみを該第1線画像に重ねてできる線
    画像を認識することを特徴とする線画像認識方法。
  2. 【請求項2】請求項1記載の線画像認識方法において、
    原稿画像を各ピクセル毎の離散値によるデータに変換
    し、該変換されたデータを第1閾値及び該第1閾値と異
    なる第2閾値と比較し、その大小関係に応じて前記第1
    領域乃至第3領域を決定することを特徴とする線画像認
    識方法。
  3. 【請求項3】請求項1あるいは2記載の線画像認識方法
    において、前記第1領域及び前記第3領域の中心線の抽
    出は、該領域の細線化によってなされることを特徴とす
    る線画像認識方法。
JP1052550A 1989-03-03 1989-03-03 線画像認識方法 Expired - Lifetime JP2789647B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1052550A JP2789647B2 (ja) 1989-03-03 1989-03-03 線画像認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1052550A JP2789647B2 (ja) 1989-03-03 1989-03-03 線画像認識方法

Publications (2)

Publication Number Publication Date
JPH02231690A JPH02231690A (ja) 1990-09-13
JP2789647B2 true JP2789647B2 (ja) 1998-08-20

Family

ID=12917910

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1052550A Expired - Lifetime JP2789647B2 (ja) 1989-03-03 1989-03-03 線画像認識方法

Country Status (1)

Country Link
JP (1) JP2789647B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5859929A (en) * 1995-12-01 1999-01-12 United Parcel Service Of America, Inc. System for character preserving guidelines removal in optically scanned text

Also Published As

Publication number Publication date
JPH02231690A (ja) 1990-09-13

Similar Documents

Publication Publication Date Title
US6160913A (en) Method and apparatus for digital halftone dots detection and removal in business documents
JP3748172B2 (ja) 画像処理装置
US6389163B1 (en) Method and apparatus for automatic image segmentation using template matching filters
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US7321688B2 (en) Image processor for character recognition
US8229214B2 (en) Image processing apparatus and image processing method
JP2004280334A (ja) 画像読み取り装置
US7961941B2 (en) Color form dropout using dynamic geometric solid thresholding
US7130085B2 (en) Half-tone dot elimination method and system thereof
JP2789647B2 (ja) 線画像認識方法
US6983077B2 (en) Image processor
JP2868134B2 (ja) 画像処理方法及び装置
US5751855A (en) Method and apparatus for detecting whether an electronic image has been faxed
JP3336046B2 (ja) 像域分離装置
EP0446630A2 (en) Method and apparatus for segmenting characters in an amount field on a financial document
JP3545227B2 (ja) 画像処理方法及び装置、光学式文字読取装置
JPH05128306A (ja) 文章画像の属性判別方法
JP3020293B2 (ja) 属性判別方法
JP3618926B2 (ja) 文書画像の傾き検出方法
JP3210224B2 (ja) 文字認識装置
JPH10233930A (ja) 画像処理装置
JP2853141B2 (ja) 画像領域識別装置
JPS6331825B2 (ja)