JPH01161589A

JPH01161589A - 文字認識方法

Info

Publication number: JPH01161589A
Application number: JP62319010A
Authority: JP
Inventors: Toru Futaki; 徹二木
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1987-12-18
Filing date: 1987-12-18
Publication date: 1989-06-26
Anticipated expiration: 2012-08-25
Also published as: JP2643960B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は文字認識方法、特に光学的に入力された手書き
文字あるいは活字文字を認識する文字認識方法に関する
ものである。

［従来技術］従来、文字認識方法として文字線が黒画素、背景部が白
画素で表された２値画像において、文字パターン領域内
に存在する白画素における位相情報及び黒画素における
文字線情報を特徴とする文字認識方法が提案されている
。（電子通信学会論文誌Ｖｏ１．　Ｊ６３−Ｄ、　Ｎｏ
、　１１．小森和昭、用谷隆彦９石井健一部、飯田行恭
、“特徴集積による手書き過多仮名文字の認識”）この方法では、白画素から所定の方向を見たとき、文字
線に出会うか否かによってその白画素における位相構造
を決定し、その白画素に対応するコードを付与する。黒
画素においては、文字線の内部に存在するのかあるいは
文字線の輪郭部に存在するのかを、更に輪郭部ならばそ
の傾きも含めてコードとして与える。黒画素に対しては
、更に高次の特徴として、上下左右の方向にそれぞれ最
も近い白画素の位相構造を付与する。

しかし、従来の黒画素へ白画素の位相構造を付加する方
法には次のような欠点があった。

ｉ）黒画素に最も近い白画素、すなわち隣接した白画素
は、文字の輪郭線に沿った方向の位相構造が不安定であ
り、正しい位相構造が抽出されない危険性がある。たと
えば、文字画像の一部である第６図において、白画素Ｓ
から見た場合、本来上方向には文字線がないと見なすべ
きなのが、輪郭のわずかな凹凸によって生じたＴを文字
線として捕えてしまうことになる。

ｉｉ）黒画素に隣接した白画素の位相構造を取り入れる
ことは黒画素の局所的近傍しか見ていないことになり、
文字の背景部に含まれている情報の抽出が十分行われて
いない。

［発明が解決しようとする問題点］本発明は、上記従来例の欠点を除去し、文字の背景部に
含まれている情報を安定して抽出し、得られた特徴を輪
郭部の画素に付加することによって情報量の多い安定し
た特徴抽出を可能にする文字認識方法を提供する。。

［問題点を解決するための手段及び作用］この問題点を
解決するための一手段として、本発明の文字認識方法は
、認識すべき文字上の画素に、背景部の位相構造の情報
を付与して文字の識別をする文字認識方法において、文字の輪郭線上の画素に対して、該輪郭線の傾きと、前
記輪郭線上の前記画素から前記輪郭線の外に所定の距離
だけ離れた背景上の画素から抽出される位相構造の情報
とを付与する。

［実施例コまず、第４図、第５図に従って、背景部の位相構造を付
加する一般的な文字認識方法について説明する。

第４図は、このような処理によって付与されたコードの
例を表す図で、白画素Ｐにおいては、上下左右に操作し
た場合、上、下、及び右方向に文字線が存在するので“
コ”で表されるコードが付与される。一方、黒画素Ｑは
輪郭線上の点で、その点における輪郭線の傾きは垂直な
のでＶ”で表されるコードが、点Ｒは文字線の内部の点
なので“°工°°で表されるコードが付与されている。

第５図は、第４図に示されているコードに更に高次の特
徴を付加したもので、黒画素Ｑ、Ｒから上下左右の方向
にそれぞれ最も近い白画素の位相構造のコードを元のコ
ード“■”、“Ｉ“に付は加えている。

以上の手続きによってすべての画素にコードが付与され
、そのコード別の画素数を集計することによって特徴ベ
クトルの抽出を行っている。

以下、図面を用いて本発明の第１の実施例について詳細
に説明する。

第１図は、本実施例による方法で抽出される特徴の一部
を表す図で、Ａ、Ｂは特徴抽出が行われる点の例である
。輪郭線上の点においては、輪郭線追跡あるいは３Ｘ３
等のマスクを用いる方法などの従来技術によって、輪郭
線の傾きを求めることが可能である。本実施例では、輪
郭線の傾きは４５°を単位として８方向に分類している
。第３図の矢印は、Ａ、Ｂそれぞれの点における輪郭線
の傾きを輪郭線に垂直な法線ベクトルで表している。た
だし、法線ベクトルの向きは文字線の内部から外側へ向
かう方向にとるものとする。

次に、これらＡ、Ｂの黒画素に対して文字の背景部であ
る白画素の位相構造もとり込む。

その際、輪郭線の白画素に接している方向、すなわち第
３図の法線ベクトルで表されている方向の背景部だけに
注目すれば十分である。たとえば、第２図に示す、Ａ付
近の拡大図において明らかなように、Ａから見て法線ベ
クトルの方向以外には輪郭線の別の点Ａ＋　、Ａｚ　、
Ａｓが存在するので、その方向にある背景部の位相構造
は、Ａには取り入れる必要はない。

そこで、Ａ、Ｂの各点から法線ベクトルに方向だけを考
慮し、さらに文字の変形、雑音に対して安定して位相構
造を抽出するために、ある程度離れた白画素の位相構造
を取り入れる。この白画素を元の黒画素の補点と呼ぶこ
とにする。

次に補点の求め方について、第１図に基づいて説明する
。Ａでは法線ベクトルが上を向いているので上方向に走
査を行い、文字線もしくは外接矩形にぶつかる点をＡ′
とする。そして線分ＡＡ’をＡＡ’：ＡＡ″＝ｌ：αの
比に分ける点を補点Ａ″として選ぶ。αは定数で、０．
３〜０．５の値にするのが一般的であるが、最適値は認
識対象によって異なる。α＝Ｏのとき、補点Ａ″はへの
隣接点になる。Ａにおける法線ベクトルは上向きなので
、補点Ａ″から見て下方向に文字線は必ず存在するので
Ａ″における位相構造を求めるとき下方向は考慮する必
要がない。この場合は、第９図の上段に示すように、上
及び左右方向の文字線の有無が情報となり、２３＝８次
元の特徴ベクトルが抽出される。

Ｂは法線ベクトルが斜めになる例で、この場合もＢから
法線ベクトルの方向に操作して最初に文字線もしくは外
接矩形にぶつかる点Ｂ′に対してＢＢ’：ＢＢ″＝１：
αとなるように補点Ｂ″を選ぶ。ただし、この場合はＢ
″から見てＢは左上方向に存在するので補点Ｂ″におけ
る位相構造としては、右方向及び下方向の文字線の有無
を調べるだけでよい。この場合は、第９図の下段に示す
ように、下及び右方向の文字線の有無が情報となり、２
２＝４次元の特徴ベクトルが抽出される。

以上の方法によると、水平もしくは垂直の４方向の輪郭
線上の黒画素に関しては、神意の特徴ベクトルが２３＝
８次元なので、４方向で４Ｘ８＝３２次元になる。一方
、斜めの輪郭線上の点に関しては、神意のベクトルが２
２＝４次元なので、４方向で４Ｘ４＝　１６次元となる
。

よって合計で３２＋　１６＝４８次元の特徴ベクトルが
得られることになる。

尚、文字の背景部の位相構造を黒画素に反映させるため
の神意の選び方は、第１の実施例の方法に限らない。

第７図は第２の実施例を表す図で、注目する黒画素りか
ら法線ベクトルの方向に一定の距離ｄだけ離れた点を神
意Ｄ″に選ぶ。この際、注目する黒画素Ｅからｄだけ離
れるまでに文字線あるいは文字の外接矩形にぶつかって
しまうときは、第１の実施例のように、線分ＥＥ’を１
＝αに内分する６、　Ｅ″を神意に選べばよい。

また、斜めの輪郭線上の点に関しては、黒画素の近傍に
おいても比較的安定に位相構造が抽出できるので、神意
な設けずに背景部の位相構造を取り入れることも可能で
ある。第８図はそれを示す第３の実施例で、斜めの輪郭
線上の点Ｆから、直接右及び下方向に走査して文字線に
ぶつかるか否かによってＦに位相構造を取り入れること
ができる。

尚、本実施例では、文字部を黒画素で、背景部を白画素
で表わす場合を説明するが、黒・白あるいは色は限定さ
れるものではない。又、説明の簡略化のため、位相構造
の抽出を輪郭線に垂直な法線ベクトル上の画素で行って
いるが、法線ベクトル上に限定する必要はない。更に、
本発明による特徴抽出の方法は、その認識対象を文字に
限定せず、一般の２次元画像の認識に応用することも可
能である。

以上説明したように、二次元文字画像から特徴ベクトル
を抽出゛し認識を行う文字認識において、輪郭線上の黒
画素にその点における傾きに応じて所定の方法で定まる
白画素の位相構造を付与することによって、文字の変形
、雑音に強く、かつ、計算量の少なくてすむ低次元の特
徴ベクトルを効果的に抽出することができ、認識性能及
び処理速度の向上に大きく役立つ−０［発明の効果］本発明により、文字の背景部に含まれている情報を安定
して抽出し、得られた特徴を輪郭部の画素に付加するこ
とによって情報量の多い安定した特徴抽出を可能にする
文字認識方法を提供できる。

【図面の簡単な説明】

第１図は本実施例によって選び出される神意の例を示す
図、第２図はそのうちＡ付近における拡大図、第３図はＡ、
Ｂにおける傾きと位相構造とを表わす図、第４図、第５図、第６図は従来技術による特徴抽出の一
例を示す図、第７図は第２の実施例の特徴抽出を示す図、第８図は第
３の実施例の特徴抽出を示す図、第９図は本実施例の神
意Ａ″、Ｂ″における位相構造を示す図である。

Claims

【特許請求の範囲】

（１）認識すべき文字上の画素に、背景部の位相構造の
情報を付与して文字の識別をする文字認識方法において
、文字の輪郭線上の画素に対して、該輪郭線の傾きと、前記輪郭線上の前記画素から前記輪郭線の外に所定の距
離だけ離れた背景上の画素から抽出される位相構造の情
報とを付与することを特徴とする文字認識方法。
（２）位相構造の情報は、輪郭線と垂直な方向に所定の
距離だけ離れた背景上の画素から抽出されることを特徴
とする特許請求の範囲第１項記載の文字認識方法。