JPH05128309A - 文字認識におけるエツジ検出方法 - Google Patents

文字認識におけるエツジ検出方法

Info

Publication number
JPH05128309A
JPH05128309A JP3318357A JP31835791A JPH05128309A JP H05128309 A JPH05128309 A JP H05128309A JP 3318357 A JP3318357 A JP 3318357A JP 31835791 A JP31835791 A JP 31835791A JP H05128309 A JPH05128309 A JP H05128309A
Authority
JP
Japan
Prior art keywords
character
edge
local
picture
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3318357A
Other languages
English (en)
Inventor
Kozo Kawada
耕三 河田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Glory Ltd
Original Assignee
Glory Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Glory Ltd filed Critical Glory Ltd
Priority to JP3318357A priority Critical patent/JPH05128309A/ja
Publication of JPH05128309A publication Critical patent/JPH05128309A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 本発明の目的は、明色の地に暗色で表わされ
た文字または暗色の地に明色で表わされた文字のいずれ
であっても短時間で文字のエッジを検出することができ
るようにすることである。 【構成】 画像領域の上端から3ラインが読み込まれた
時点から画像入力と並行して隣接画素を含む入力画像の
ある1画素について局所マスクを順に当てはめる(ステ
ップS1)。方向のある局所マスクのいずれかに合致し
たか否かを判断し(ステップS2)、方向のある局所マ
スクのいずれかに合致した場合は、その対象とした中心
の画素をエッジとして記憶すると共に(ステップS
3)、一致した局所マスクについて決定された方向をそ
れに対応させて記憶する(ステップS4)。以上の処理
を画像入力と並行して各画素ごとに全ての画素について
終了するまで行なう(ステップS5)。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、文字認識におけるエッ
ジ検出方法に関し、印刷された文字を含む広範囲な領域
から文字のエッジのみを検出する文字認識におけるエッ
ジ検出方法に関する。
【0002】
【従来の技術】例えば、雑誌の裏表紙の隅には、雑誌の
取り引きにおける事務合理化のために誌名ごとに設定さ
れた商品の番号である雑誌コードと、雑誌コード読取り
の機械化のために設けられたTコードと呼ばれる共通雑
誌コードとが印刷されている。図6は、雑誌コード及び
Tコードの例を示す図であり、同図(A)は明色の地に
暗色で印刷されたものであり、同図(B)は暗色の地に
白抜きで印刷されたものを示す。このような2種類の
(黒文字,白文字)の文字を別文字として認識しようと
すると、辞書を予め倍の量だけ確保しておかねばなら
ず、メモリをたくさん必要として効率が悪い。
【0003】この問題点を解決する手段として、例え
ば、特開平1−279385号公報に記載された技術が
ある。この技術は、入力画像全体の全ての画素について
白画素であるか黒画素であるかを判断して各々の個数を
計数し(画像の統計量を求め)、もし黒画素の方が多け
れば白抜きの文字と判断して白画素と黒画素とを全て反
転させることにより、黒文字,白文字のいずれであって
も同様に認識を行なえるようにするものである。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た公報に記載の技術においては、画像の統計量を求める
ために画像の全領域に対して走査してメモリに格納する
時間を必要とし、更に白抜き文字の場合にはソフトウェ
ア処理によりもう一度全ての画素を読み出して反転する
必要があった。したがって、特に雑誌コードの認識の場
合など、文字エリアに対する画像エリアの比率が大きい
場合に画像走査時間が長時間化することはシステムにと
って重大な問題点であった。
【0005】本発明は上述のような事情から成されたも
のであり、本発明の目的は、明色の地に暗色で表わされ
た文字または暗色の地に明色で表わされた文字のいずれ
であっても短時間で文字のエッジを検出することができ
る文字認識におけるエッジ検出方法を提供することにあ
る。
【0006】
【課題を解決するための手段】本発明は、印刷された文
字を含む広範囲な領域から文字のエッジのみを検出する
文字認識におけるエッジ検出方法に関するものであり、
本発明の上記目的は、エッジの存否及びその方向がそれ
ぞれ定められた複数の局所マスクを用意しておき、文字
の入力画像の画素ごとに、前記局所マスクを一つずつ当
てはめていって一致した局所マスクに係るエッジの存否
及びその方向の情報をその画素についての情報とするこ
とにより、前記文字全体のエッジを検出することによっ
て達成される。
【0007】
【作用】本発明にあっては、エッジの存否及びその方向
がそれぞれ定められた複数の局所マスクを用意してお
き、文字の入力画像の画素ごとに、前記局所マスクを一
つずつ当てはめていって一致した局所マスクに係るエッ
ジの存否及びその方向の情報をその画素についての情報
とするという処理をすべての画素について順次行なうこ
とにより、明色の地に暗色で表された文字と暗色の地に
明色で表された文字のいずれにおいても区別することな
く文字のエッジを検出することができる。
【0008】
【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。先ず、本発明の前提となる画像入力
から文字認識に至るまでの処理の流れを説明する。図4
は、その処理の流れを示す図である。そこで、文字エリ
アを含む広範囲なエリアの画像を2値化しながら読み込
んでいき(ステップS41)、上端から3ラインが読み
込まれた時点で画像入力と並行して後に詳述するように
局所マスクを順次当てはめていき、エッジ検出を行なう
(ステップS42)。そのとき、2値画像が予めエッジ
と定めた局所マスクと一致したならば、その画素をエッ
ジとみなし、同時にエッジの方向も記憶する。エッジの
検出が終了するとセグメント化を行ない、以下の示すよ
うに1文字ずつ文字を認識していく(ステップS4
3)。
【0009】図5は、文字認識の手順を説明するための
図である。先ず、文字を2値化した画像情報を得る(ス
テップS51)。ここでは文字“2”を例に挙げてい
る。次に、黒文字,白文字のいずれであっても本発明の
方法により文字の輪郭点とその方向及び外接矩形を求め
る(ステップS52)。文字をその外接矩形を基準に上
下左右にそれぞれ二分し、4つの領域(R11
12,R21,R22)を作成する(ステップS5
3)。各領域に含まれる方向別の輪郭点の個数を計算す
る(ステップS54)。たとえば、R11の領域におけ
る方向xの個数がX11の如きである。これにより4つ
の領域全てで16個の特徴量が得られる。最後に、各カ
テゴリーとの距離を計算する(ステップS55)。尚、
距離は数1に示す式により算出される。
【0010】
【数1】 ここで、F :入力文字の特徴量 Fik:カテゴリーkの文字の標準特徴量 である。
【0011】計算の結果により距離が最小となるカテゴ
リーに対応する文字を認識文字とする。
【0012】次に、本発明の文字認識におけるエッジ検
出方法の一実施例について詳細に説明する。本発明で
は、図2(A)に示すように、検査の対象となる画素A
に対して3つの隣接画素X,Y2,Y1を設定考慮す
る。各画素の濃度値の2値化として“1”又は“0”を
得る。そこで、(A,X,Y2,Y1)の“1”,
“0”の組み合わせで生じるパターン((a)〜
(p))について、その部分をエッジと見做した場合の
エッジの方向を決める。方向は図2(A)の示すような
4つの方向と方向なし(0)すなわちエッジではないも
のに分けられる。
【0013】このような局所マスクとしてのパターンを
予め設定しておき、図1に示すエッジ検出の詳細手順を
実行する。すなわち、前述のように画像領域の上端から
3ラインが読み込まれた時点から画像入力と並行して隣
接画素を含む入力画像のある1画素について局所マスク
を順に当てはめる(ステップS1)。方向のある局所マ
スクのいずれかに合致したか否かを判断する(ステップ
S2)。方向なしの局所マスクに合致した場合は、直接
ステップS5に移行する。一方、方向のある局所マスク
のいずれかに合致した場合は、その対象とした中心の画
素をエッジとして記憶すると共に(ステップS3)、一
致した局所マスクについて決定された方向をそれに対応
させて記憶する(ステップS4)。尚、局所マスクとの
合致の判断処理は局所処理であるので容易にハードウェ
アで実行可能である。最後に、全ての画素について終了
したか否かを判断し(ステップS5)、終了していない
場合はステップS1に戻り、画像入力と並行して次の画
素について同様に判断する。
【0014】図3は、本発明のエッジ検出方法によりエ
ッジを検出した具体例を示す図であり、同図(A)は黒
文字(明色の地に暗色で表された文字)の例であり、同
図(B)は白文字(暗色の地に明色で表された文字)の
例である。同図において、エッジと認定された画素に対
応して記載されたアルファベットはパターンの種類を示
すものである。この具体例から分かるように黒文字,白
文字のいずれであっても同じ方法でエッジを認識でき
る。
【0015】図7(A)及び(B)は、局所マスクのパ
ターンの別の設定の仕方及び各パターンについて決定さ
れる方向を方向テーブルとして示す図である。この場
合、画素Aに対しての隣接画素をその画素を取り囲むよ
うな4つとし、その4つの隣接画素の2値化値と画素A
の2値化値とでエッジか否かを判断するようにするもの
である。しかしながら、画素A自身が白(“0”)なら
ば無条件にエッジとしないようにしている。もし白抜き
文字ならば外側にかならずエッジ点が現れるからであ
る。
【0016】図8は、その局所マスクのパターンを列挙
した図である。図9は、この方法によりエッジを検出し
た具体例を示す図である。この方法によれば、エッジと
見做される点は黒文字の場合は同図に示すように全て文
字の内側の黒い部分に検出され、白文字の場合は文字の
外側の黒い部分に検出される。
【0017】ところで、(A,X2,X1,Y2,Y
1)の値が(1,0,0,0,0)の場合、前述の図2
に示すパターンの設定方法によればその点はエッジ点と
見做してしまうが、この局所マスクの設定の仕方によれ
ばエッジ点とは見做さないのでエッジ検出が正確とな
る。尚、図2の方法によりそのような場合にエッジとし
て検出しても、そのような孤立点はノイズとして別途除
去可能である。
【0018】以上が本発明の実施例であるが、局所マス
クのパターンの型は以上に挙げた例に限られることはな
く、この他にも種々の変形例が考えられる。
【0019】
【発明の効果】以上のように本発明の文字認識における
エッジ検出方法によれば、明色の地に暗色で表わされた
文字または暗色の地に明色で表わされた文字のいずれで
あっても短時間で文字のエッジを検出することができ
る。また、画像全体の統計量を求めることなく局所処理
可能な方式を採用しているので、ハードウェア化が容易
となり、その場合には画像入力と並行して処理が可能と
なる。更に、文字のエッジがとぎれなく検出できるの
で、数字などの非分離文字の場合、そのエッジ情報を用
いての文字セグメントが容易に行なえる。エッジ情報と
してはその方向(4方向)の情報も同時に得られるの
で、その方向情報を用いてパターンマッチングによる文
字認識が可能となる。文字のエッジがとぎれなく検出で
きるので、エッジを追跡して構造解析による文字認識に
も適用可能である。
【0020】一方、本発明の文字認識におけるエッジ検
出方法を雑誌コード及びTコードに採用した場合、画像
領域に対する文字領域の比率が小さく、エッジ情報だけ
をデータ領域に持つことによりデータ数が少なくなり
(画像レベルで1/16)、処理の高速化及びメモリ領
域の削減が図れる。
【図面の簡単な説明】
【図1】本発明の文字認識におけるエッジ検出方法の一
実施例の手順を示すフローチャートである。
【図2】局所マスクの設定方法の一例とそのすべてのパ
ターンを列挙した図である。
【図3】本発明のエッジ検出方法によりエッジを検出し
た具体例を示す図である。
【図4】画像入力から文字認識に至るまでの処理の流れ
を説明するフローチャートである。
【図5】文字認識の手順を説明するための図である。
【図6】雑誌コード及びTコードの例を示す図である。
【図7】局所マスクの設定方法の他の例とその方向テー
ブルを示す図である。
【図8】局所マスクの他の例によるパターンを列挙した
図である。
【図9】局所マスクの他の例の方法によりエッジを検出
した具体例を示す図である。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 エッジの存否及びその方向がそれぞれ定
    められた複数の局所マスクを用意しておき、文字の入力
    画像の画素ごとに、前記局所マスクを一つずつ当てはめ
    ていって一致した局所マスクに係るエッジの存否及びそ
    の方向の情報をその画素についての情報とすることによ
    り、前記文字全体のエッジを検出するようにしたことを
    特徴とする文字認識におけるエッジ検出方法。
  2. 【請求項2】 画像入力と並行して入力された画素に対
    して逐次前記局所マスクを一つずつ当てはめる処理を行
    なう請求項1に記載の文字認識におけるエッジ検出方
    法。
JP3318357A 1991-11-06 1991-11-06 文字認識におけるエツジ検出方法 Pending JPH05128309A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3318357A JPH05128309A (ja) 1991-11-06 1991-11-06 文字認識におけるエツジ検出方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3318357A JPH05128309A (ja) 1991-11-06 1991-11-06 文字認識におけるエツジ検出方法

Publications (1)

Publication Number Publication Date
JPH05128309A true JPH05128309A (ja) 1993-05-25

Family

ID=18098253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3318357A Pending JPH05128309A (ja) 1991-11-06 1991-11-06 文字認識におけるエツジ検出方法

Country Status (1)

Country Link
JP (1) JPH05128309A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001202543A (ja) * 2000-01-18 2001-07-27 Mitsubishi Electric Corp 通行車両課金装置
JP2010186246A (ja) * 2009-02-10 2010-08-26 Nec Corp 画像処理装置、方法、及び、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001202543A (ja) * 2000-01-18 2001-07-27 Mitsubishi Electric Corp 通行車両課金装置
JP2010186246A (ja) * 2009-02-10 2010-08-26 Nec Corp 画像処理装置、方法、及び、プログラム

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
EP1497787B1 (en) System and method for identifying and extracting character strings from captured image data
US4891750A (en) Optical character recognition by forming and detecting matrices of geo features
US5164996A (en) Optical character recognition by detecting geo features
JPH0792820B2 (ja) 文字認識方法
US5233672A (en) Character reader and recognizer with a specialized editing function
JPH05128309A (ja) 文字認識におけるエツジ検出方法
US6483943B1 (en) Feature value extraction methods and apparatus for image recognition and storage medium for storing image analysis program
JPH07168910A (ja) 文書レイアウト解析装置及び文書フォ−マット識別装置
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JP3476595B2 (ja) 画像領域分割方法、および画像2値化方法
US5408540A (en) Character slant recognition in a word image
Kumar et al. Analysis of OMR sheet using machine learning model
JP7532124B2 (ja) 情報処理装置、情報処理方法及びプログラム
JPH11184965A (ja) 帳票識別登録装置
JP2674475B2 (ja) 文字読取装置
JPH06111057A (ja) 光学的文字読取装置
JP2882056B2 (ja) 特定パターンの識別方法
CN115830607A (zh) 基于人工智能的文本识别方法、装置、计算机设备及介质
JPS622382A (ja) 画像処理方法
JPH0573718A (ja) 領域属性識別方式
JPH06227098A (ja) ドットパターン検査装置
JP2953162B2 (ja) 文字認識装置
JP3564987B2 (ja) 光学式文字読取装置
JPH08171609A (ja) 文字列高速抽出装置