JPH05128309A

JPH05128309A - 文字認識におけるエツジ検出方法

Info

Publication number: JPH05128309A
Application number: JP3318357A
Authority: JP
Inventors: Kozo Kawada; 耕三河田
Original assignee: Glory Ltd
Current assignee: Glory Ltd
Priority date: 1991-11-06
Filing date: 1991-11-06
Publication date: 1993-05-25

Abstract

(57)【要約】【目的】本発明の目的は、明色の地に暗色で表わされ
た文字または暗色の地に明色で表わされた文字のいずれ
であっても短時間で文字のエッジを検出することができ
るようにすることである。【構成】画像領域の上端から３ラインが読み込まれた
時点から画像入力と並行して隣接画素を含む入力画像の
ある１画素について局所マスクを順に当てはめる（ステ
ップＳ１）。方向のある局所マスクのいずれかに合致し
たか否かを判断し（ステップＳ２）、方向のある局所マ
スクのいずれかに合致した場合は、その対象とした中心
の画素をエッジとして記憶すると共に（ステップＳ
３）、一致した局所マスクについて決定された方向をそ
れに対応させて記憶する（ステップＳ４）。以上の処理
を画像入力と並行して各画素ごとに全ての画素について
終了するまで行なう（ステップＳ５）。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、文字認識におけるエッ
ジ検出方法に関し、印刷された文字を含む広範囲な領域
から文字のエッジのみを検出する文字認識におけるエッ
ジ検出方法に関する。

【０００２】

【従来の技術】例えば、雑誌の裏表紙の隅には、雑誌の
取り引きにおける事務合理化のために誌名ごとに設定さ
れた商品の番号である雑誌コードと、雑誌コード読取り
の機械化のために設けられたＴコードと呼ばれる共通雑
誌コードとが印刷されている。図６は、雑誌コード及び
Ｔコードの例を示す図であり、同図（Ａ）は明色の地に
暗色で印刷されたものであり、同図（Ｂ）は暗色の地に
白抜きで印刷されたものを示す。このような２種類の
（黒文字，白文字）の文字を別文字として認識しようと
すると、辞書を予め倍の量だけ確保しておかねばなら
ず、メモリをたくさん必要として効率が悪い。

【０００３】この問題点を解決する手段として、例え
ば、特開平１−２７９３８５号公報に記載された技術が
ある。この技術は、入力画像全体の全ての画素について
白画素であるか黒画素であるかを判断して各々の個数を
計数し（画像の統計量を求め）、もし黒画素の方が多け
れば白抜きの文字と判断して白画素と黒画素とを全て反
転させることにより、黒文字，白文字のいずれであって
も同様に認識を行なえるようにするものである。

【０００４】

【発明が解決しようとする課題】しかしながら、上述し
た公報に記載の技術においては、画像の統計量を求める
ために画像の全領域に対して走査してメモリに格納する
時間を必要とし、更に白抜き文字の場合にはソフトウェ
ア処理によりもう一度全ての画素を読み出して反転する
必要があった。したがって、特に雑誌コードの認識の場
合など、文字エリアに対する画像エリアの比率が大きい
場合に画像走査時間が長時間化することはシステムにと
って重大な問題点であった。

【０００５】本発明は上述のような事情から成されたも
のであり、本発明の目的は、明色の地に暗色で表わされ
た文字または暗色の地に明色で表わされた文字のいずれ
であっても短時間で文字のエッジを検出することができ
る文字認識におけるエッジ検出方法を提供することにあ
る。

【０００６】

【課題を解決するための手段】本発明は、印刷された文
字を含む広範囲な領域から文字のエッジのみを検出する
文字認識におけるエッジ検出方法に関するものであり、
本発明の上記目的は、エッジの存否及びその方向がそれ
ぞれ定められた複数の局所マスクを用意しておき、文字
の入力画像の画素ごとに、前記局所マスクを一つずつ当
てはめていって一致した局所マスクに係るエッジの存否
及びその方向の情報をその画素についての情報とするこ
とにより、前記文字全体のエッジを検出することによっ
て達成される。

【０００７】

【作用】本発明にあっては、エッジの存否及びその方向
がそれぞれ定められた複数の局所マスクを用意してお
き、文字の入力画像の画素ごとに、前記局所マスクを一
つずつ当てはめていって一致した局所マスクに係るエッ
ジの存否及びその方向の情報をその画素についての情報
とするという処理をすべての画素について順次行なうこ
とにより、明色の地に暗色で表された文字と暗色の地に
明色で表された文字のいずれにおいても区別することな
く文字のエッジを検出することができる。

【０００８】

【実施例】以下、図面に基づいて本発明の実施例につい
て詳細に説明する。先ず、本発明の前提となる画像入力
から文字認識に至るまでの処理の流れを説明する。図４
は、その処理の流れを示す図である。そこで、文字エリ
アを含む広範囲なエリアの画像を２値化しながら読み込
んでいき（ステップＳ４１）、上端から３ラインが読み
込まれた時点で画像入力と並行して後に詳述するように
局所マスクを順次当てはめていき、エッジ検出を行なう
（ステップＳ４２）。そのとき、２値画像が予めエッジ
と定めた局所マスクと一致したならば、その画素をエッ
ジとみなし、同時にエッジの方向も記憶する。エッジの
検出が終了するとセグメント化を行ない、以下の示すよ
うに１文字ずつ文字を認識していく（ステップＳ４
３）。

【０００９】図５は、文字認識の手順を説明するための
図である。先ず、文字を２値化した画像情報を得る（ス
テップＳ５１）。ここでは文字“２”を例に挙げてい
る。次に、黒文字，白文字のいずれであっても本発明の
方法により文字の輪郭点とその方向及び外接矩形を求め
る（ステップＳ５２）。文字をその外接矩形を基準に上
下左右にそれぞれ二分し、４つの領域（Ｒ_１１，
Ｒ_１２，Ｒ_２１，Ｒ_２２）を作成する（ステップＳ５
３）。各領域に含まれる方向別の輪郭点の個数を計算す
る（ステップＳ５４）。たとえば、Ｒ_１１の領域におけ
る方向ｘの個数がＸ_１１の如きである。これにより４つ
の領域全てで１６個の特徴量が得られる。最後に、各カ
テゴリーとの距離を計算する（ステップＳ５５）。尚、
距離は数１に示す式により算出される。

【００１０】

【数１】ここで、Ｆ_ｉ：入力文字の特徴量Ｆ_ｉｋ：カテゴリーｋの文字の標準特徴量である。

【００１１】計算の結果により距離が最小となるカテゴ
リーに対応する文字を認識文字とする。

【００１２】次に、本発明の文字認識におけるエッジ検
出方法の一実施例について詳細に説明する。本発明で
は、図２（Ａ）に示すように、検査の対象となる画素Ａ
に対して３つの隣接画素Ｘ，Ｙ２，Ｙ１を設定考慮す
る。各画素の濃度値の２値化として“１”又は“０”を
得る。そこで、（Ａ，Ｘ，Ｙ２，Ｙ１）の“１”，
“０”の組み合わせで生じるパターン（（ａ）〜
（ｐ））について、その部分をエッジと見做した場合の
エッジの方向を決める。方向は図２（Ａ）の示すような
４つの方向と方向なし（０）すなわちエッジではないも
のに分けられる。

【００１３】このような局所マスクとしてのパターンを
予め設定しておき、図１に示すエッジ検出の詳細手順を
実行する。すなわち、前述のように画像領域の上端から
３ラインが読み込まれた時点から画像入力と並行して隣
接画素を含む入力画像のある１画素について局所マスク
を順に当てはめる（ステップＳ１）。方向のある局所マ
スクのいずれかに合致したか否かを判断する（ステップ
Ｓ２）。方向なしの局所マスクに合致した場合は、直接
ステップＳ５に移行する。一方、方向のある局所マスク
のいずれかに合致した場合は、その対象とした中心の画
素をエッジとして記憶すると共に（ステップＳ３）、一
致した局所マスクについて決定された方向をそれに対応
させて記憶する（ステップＳ４）。尚、局所マスクとの
合致の判断処理は局所処理であるので容易にハードウェ
アで実行可能である。最後に、全ての画素について終了
したか否かを判断し（ステップＳ５）、終了していない
場合はステップＳ１に戻り、画像入力と並行して次の画
素について同様に判断する。

【００１４】図３は、本発明のエッジ検出方法によりエ
ッジを検出した具体例を示す図であり、同図（Ａ）は黒
文字（明色の地に暗色で表された文字）の例であり、同
図（Ｂ）は白文字（暗色の地に明色で表された文字）の
例である。同図において、エッジと認定された画素に対
応して記載されたアルファベットはパターンの種類を示
すものである。この具体例から分かるように黒文字，白
文字のいずれであっても同じ方法でエッジを認識でき
る。

【００１５】図７（Ａ）及び（Ｂ）は、局所マスクのパ
ターンの別の設定の仕方及び各パターンについて決定さ
れる方向を方向テーブルとして示す図である。この場
合、画素Ａに対しての隣接画素をその画素を取り囲むよ
うな４つとし、その４つの隣接画素の２値化値と画素Ａ
の２値化値とでエッジか否かを判断するようにするもの
である。しかしながら、画素Ａ自身が白（“０”）なら
ば無条件にエッジとしないようにしている。もし白抜き
文字ならば外側にかならずエッジ点が現れるからであ
る。

【００１６】図８は、その局所マスクのパターンを列挙
した図である。図９は、この方法によりエッジを検出し
た具体例を示す図である。この方法によれば、エッジと
見做される点は黒文字の場合は同図に示すように全て文
字の内側の黒い部分に検出され、白文字の場合は文字の
外側の黒い部分に検出される。

【００１７】ところで、（Ａ，Ｘ２，Ｘ１，Ｙ２，Ｙ
１）の値が（１，０，０，０，０）の場合、前述の図２
に示すパターンの設定方法によればその点はエッジ点と
見做してしまうが、この局所マスクの設定の仕方によれ
ばエッジ点とは見做さないのでエッジ検出が正確とな
る。尚、図２の方法によりそのような場合にエッジとし
て検出しても、そのような孤立点はノイズとして別途除
去可能である。

【００１８】以上が本発明の実施例であるが、局所マス
クのパターンの型は以上に挙げた例に限られることはな
く、この他にも種々の変形例が考えられる。

【００１９】

【発明の効果】以上のように本発明の文字認識における
エッジ検出方法によれば、明色の地に暗色で表わされた
文字または暗色の地に明色で表わされた文字のいずれで
あっても短時間で文字のエッジを検出することができ
る。また、画像全体の統計量を求めることなく局所処理
可能な方式を採用しているので、ハードウェア化が容易
となり、その場合には画像入力と並行して処理が可能と
なる。更に、文字のエッジがとぎれなく検出できるの
で、数字などの非分離文字の場合、そのエッジ情報を用
いての文字セグメントが容易に行なえる。エッジ情報と
してはその方向（４方向）の情報も同時に得られるの
で、その方向情報を用いてパターンマッチングによる文
字認識が可能となる。文字のエッジがとぎれなく検出で
きるので、エッジを追跡して構造解析による文字認識に
も適用可能である。

【００２０】一方、本発明の文字認識におけるエッジ検
出方法を雑誌コード及びＴコードに採用した場合、画像
領域に対する文字領域の比率が小さく、エッジ情報だけ
をデータ領域に持つことによりデータ数が少なくなり
（画像レベルで１／１６）、処理の高速化及びメモリ領
域の削減が図れる。

【図面の簡単な説明】

【図１】本発明の文字認識におけるエッジ検出方法の一
実施例の手順を示すフローチャートである。

【図２】局所マスクの設定方法の一例とそのすべてのパ
ターンを列挙した図である。

【図３】本発明のエッジ検出方法によりエッジを検出し
た具体例を示す図である。

【図４】画像入力から文字認識に至るまでの処理の流れ
を説明するフローチャートである。

【図５】文字認識の手順を説明するための図である。

【図６】雑誌コード及びＴコードの例を示す図である。

【図７】局所マスクの設定方法の他の例とその方向テー
ブルを示す図である。

【図８】局所マスクの他の例によるパターンを列挙した
図である。

【図９】局所マスクの他の例の方法によりエッジを検出
した具体例を示す図である。

Claims

【特許請求の範囲】

【請求項１】エッジの存否及びその方向がそれぞれ定
められた複数の局所マスクを用意しておき、文字の入力
画像の画素ごとに、前記局所マスクを一つずつ当てはめ
ていって一致した局所マスクに係るエッジの存否及びそ
の方向の情報をその画素についての情報とすることによ
り、前記文字全体のエッジを検出するようにしたことを
特徴とする文字認識におけるエッジ検出方法。
【請求項２】画像入力と並行して入力された画素に対
して逐次前記局所マスクを一つずつ当てはめる処理を行
なう請求項１に記載の文字認識におけるエッジ検出方
法。