JPH01292589A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH01292589A
JPH01292589A JP63123147A JP12314788A JPH01292589A JP H01292589 A JPH01292589 A JP H01292589A JP 63123147 A JP63123147 A JP 63123147A JP 12314788 A JP12314788 A JP 12314788A JP H01292589 A JPH01292589 A JP H01292589A
Authority
JP
Japan
Prior art keywords
character
feature vector
category
recognition
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63123147A
Other languages
English (en)
Other versions
JP2976426B2 (ja
Inventor
Keiji Yamada
山田 敬嗣
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP63123147A priority Critical patent/JP2976426B2/ja
Publication of JPH01292589A publication Critical patent/JPH01292589A/ja
Application granted granted Critical
Publication of JP2976426B2 publication Critical patent/JP2976426B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本願発明は、文字の輪郭線から特徴ベクトルをもとめた
後、その特徴ベクトルを用いて識別を行い、認識の評価
値が低い場合には再試行をおこなう制御手段を備えた文
字認識方法に関するものである。
(従来の技術) 従来の文字認識方法には2通りの方法がある。
1つは、予め認識すべき文字データの集合がら判別分析
や主成分分析などの統計手法により特徴を抽出し辞書と
して記憶しておき、認識処理では入力された文字データ
から辞書作成と同じ方法により特徴を抽出し、辞書との
類似度を計算し、最もよい類似度を持つカテゴリに認識
する線形識別関数を用いた方法である。もう1つは、認
識すべき文字の構造を予め構造解析により求めて、その
結果を辞書として記憶しておき、認識処理では入力され
た文字データの構造解析を行い、辞書に登録された構造
との照合を行い、最も高い類似度を持っカテゴリに認識
する構造解析による方法である。
(発明が解決しようとする問題点) 手書き文字の特徴としては、文字線のがずれによる欠落
やにじみによる穴のつぷれが多いことや、非線形な位置
の変化や文字の位相構造が変化することが挙げられる。
前述の従来手法のうち線形識別関数を用いた方法では、
線の途切れや穴のつぶれなどの文字特徴の欠落には比較
的強いが、文字線の非線形な移動や位4目構造の変化に
は追従できず認識できないことが多い。一方、構造解析
に基づく文字認識方法では、文字線の非線形な移動には
比較的強いが位相構造の変化には追従できず、さらに構
造解析処理は文字線自体の凸凹や線の途切れ穴のつぶれ
に影響され正確な構造を抽出できないことがある。
本発明の目的は、このような従来知られている文字認識
方法の文字線の途切れや穴のっぷれや非線形な位置変化
、位相構造の変化という多様な変化に追従できないとい
う欠点を除去せしめ、人力された文字の変化が大きい場
合にはその変化に追従するように文字認識処理で用いる
パラメータを修正して正確に文字を認識する文字認識方
法を提供することにある。
(問題点を解決するための手段) 本願発明に関する文字認識方法は、文字の輪郭線の形状
から文字の特徴量を計算して認識処理を行う文字認識方
法において、文字画像の輪郭線の曲率に基づいて局所構
造に分割し、文字を区切った小領域内での局所構造の種
類及び方向別の局所構造の大きさの総和を要素とした特
徴ベクトルを求める特徴抽出手段と、カテゴリ毎の特徴
軸と入力文字の特徴ベクトルとからカテゴリ毎のスコア
を計算する手段と、カテゴリ毎の禁止則と人力特徴ベク
トルとからカテゴリ毎の禁止特徴の有無を判定する手段
と、前記スコアと禁止特徴の有無の判定結果を統合して
、認識結果を求める手段と、認識結果の評価値が低い場
合を判定し、その場合には前記特徴抽出で用いたパラメ
ータを再設定して特徴抽出処理から再試行することを制
御する手段を、備えたことを特徴としている。
(作用) 本願発明においては、文字画像の輪郭線の曲率に基づい
て局所構造を抽出することにより、手書き変動により消
えがちな局所的な構造特徴を抽出し、認識に利用できる
ようにした上で、構造解析を局所にとどめることにより
位相構造変化に影響されないようにしている。さらに、
局所構造の特徴を文字を区切った小領域内で総和をとり
、それによって特徴ベクトルを求めて識別関数によりス
コアをもとめて正解カテゴリを選択することにより、構
造解析法の欠点である線の途切れや穴のつぶれによる構
造の変化に影響されて構造解析を誤るという問題点を除
去し、位相構造の変化にも影−響されにくい認識処理を
構成できる。また禁止則の導入により判別しにくい文字
を局所構造の有無に基づき認識を可能にしている。文字
の変形が著しく1回の認識処理では判別できないような
文字の認識では、判別困難なカテゴリを詳細に区別でき
るようにパラメータを再設定して認識処理を再試行する
ことにより正しい認識が可能になる。
(実施例) 以下、本願発明の実施例を図面を参照して説明する。第
1図は、本願発明の文字認識方法の処理の流れを示す。
認識すべき文字は、入力文字データ101として1文字
づつ入力され、局所構造解析102がなされた後、特徴
ベクトル計算103がなされる。特徴ベクトルから各カ
テゴリ毎のスコア計算104と禁止則チエツク105が
なされ、その結果を用いてリジェクトの判定106を行
い、もし認識結果が受理されたなら1文字認識処理を終
了108シ、リジェクトされたならパラメータの再設定
107をして、上記の認識処理を再試行する。
これらの処理をさらに詳しく説明する。人力文字データ
101は、白黒の二値画像とし、黒画素は1、白画素は
Oの値を持つとする。そのデータを用いた局所構造解析
の流れを第2図にしたがって説明する。まず、文字の大
きさがほぼ一定になるように文字サイズの正規化201
をおこなう。ここでは、文字データをf(x、 y)を
表わし、文字部ではf(x、 y) = 1とし、背景
部ではf(x、 y) = Oとする。そこで、線形内
挿法により、f(x、y)からf 1(Xl、 yl)
をもとめ、しきい値0.5によりf ’(x、 y)を
二値化し、正規化された二値画像を得る。次に、その二
値画像の黒画素と白画素との隣接する位置を順に探索す
ることにより輪郭抽出202を行い、203のフロック
では、その輪郭上の各点から両方向に長さLの触手をの
ばし、両方向の触手をなす角度を曲率とすることにより
輪郭の曲率を計算し、さらに両方向にのばした触手の方
向の平均を輪郭の方向とする。続くブロック204では
、連続するL′個の曲率のデータから曲率の平滑化をす
る。ここでは、正規化処理は横30画素縦40画素程度
になるようにし、曲率計算の触手長りを5画素、曲率平
滑化の画素数L′を5画素と仮定する。上記平滑化され
た曲率データをもとにブロック205で局所構造への分
割を行う。ここで、局所構造としては、以下の5種類の
ものを用いる。局所構造の抽出には、曲率Φ(s)(s
は起点がらの輪郭上の距離)と4つのパラメータt1〜
L4(t4〉t3〉t2〉tl)をもちいる。
(0)直線分(t2<Φ(s) < taなるSの区間
)(1)正曲率の曲線分(L3<Φ(s) < t4な
るSの区間)(2)負曲率の曲線分(Ll<Φ(s)<
t2なるSの区間)(3)正曲率の屈曲点(t4<φ(
s)なるSの区間)(4)負曲率の屈曲点(φ(s)<
tlなるSの区間)前述の仮定条件のもとでは、L4は
1.2、t3はo、2、t2は一〇、2、t□は−1,
2に設定する。
ブロック206では、近接する同種の局所構造のうちそ
れらの間隔がしきい値以下の場合には、該当する2つの
局所構造を統合し1つにする。このしきい値は実施例で
は1画素とした。また、ブロック207では局所構造の
うち曲線分は、各局所構造の部分における曲率の総和が
、n/2を越えないように分割される。屈曲点では、同
様に3■/2を越えないように分割される。このように
して求められた局所構造は、ブロック208において、
その始点、終点の座標と方向、平均曲率、エツジ上の長
さとして記録される。この様にして抽出された局所構造
の例を第3図に示す。同図(a)は、抽出された文字の
輪郭線を示し、同図(b)は抽出された局所構造の例を
示す。第3図において白丸から白丸までを結んだ実線分
が1つの局所構造である。302は直線分であり、30
3は正曲率の曲線分、304は負曲率の曲線分、305
は正曲率の屈曲点、506は負曲率の例である。
次にブロック102の特徴ベクトルの計算の手順につい
て第4図を用いて説明する。まず、ブロック401にお
ける局所構造の位置計算では、局所構造の始点と終点の
座標の平均を便宜的に局所構造の位置とし、さらに文字
をnXmの粗メツシユで区切り、局所構造の属するメツ
シュの位置(i、j)(0≦i≦n−1,0≦j≦m−
1)を求める。ブロック402では、局所構造の始点の
方向ベクトルと終点の方向ベクトルの平均ベクトルによ
り局所構造の方向を定め、これを45°おきの8方向に
量子化し、方向コードq(0≦q≦7)を求める。以上
の局所構造の種類番号p(上記の(0)から(4))、
メソシュの位置(i、j)、方向dを用いて特徴ベクト
ルの要素番号 に=((i−m+j)・8+q)・5+p+1を求め、
特徴ベクトル[φk](k=1−D、D=n−m−5−
8)に特微量を加算する。ブロック403で局所構造が
屈曲点か否かを判定し、屈曲点の場合にはブロック40
6に進み特徴ベクトルの要素に特微量として1を加算し
、屈曲点でなければブロック404に進み局所構造の大
きさとして、局所構造の始点から終点までの輪郭線上の
距離を特徴とする求めブロック405において、特徴ベ
クトルの要素に加算する。全局所構造についての処理を
終了するまで、ブロック401から407までの処理を
繰り返して、入力文字データの特徴ベクトル[、、、]
を求める。
つづいて、スコア計算104と禁止則のチエツク105
の実際の処理の流れを第5図にしたがって説明する。ま
ず、ブロック501において全カテゴリに対してスコア
を計算する。その方法は、各カテゴリごとに特徴軸上に
特徴ベクトルを正射影して、その長さをカテゴリごとの
スコアs、(jはカテゴリの番号)とする。第jカテゴ
リの特徴軸の単位ベクトルを[a、、c]とすると、 Sj=[a、IC]・陣ぽ −ゑFAJk’ψk k=0 ここで、[里、、]* (k :O≦に≦D)は[甲k
] (k : 1≦に≦D)の斉次ベクトルとし、Φ。
=1とする。つぎに、ブロック502で最大スコアS、
1を持つカテゴリJ1求め、ブロック503でカテゴリ
J0に対して禁止則のチエツクを行う。禁止則とは各カ
テゴリごとに生起してはならない特徴ベクトルの要素の
集合を記述したベクトル[b、k] (k : 1≦に
≦D)である。ただし、b、、=1:第に要素がカテゴ
1月で生起しない場合0:第に要素がカテゴリjで生起
する可能性がある場合 そこで、ブロック503での禁止則のチエツクとは禁止
則[bJllc]と特徴ベクトル[盟]の内積をもとめ
、RJl ” [bJlk]・[甲k] を計算することであり、ブロック504の禁止特徴を持
つか否かの判定は、RJlが正か0かの判定であり、も
しRJlが0で、入力文字がJlに対する禁止特徴を持
たなければカテゴリJ工を第1候補とし次のブロック5
06にすすむが、RJlが正で入力文字がカテゴリJ1
にり1する禁止特徴を持てばブロック505でカテゴリ
J1を除去して再びブロック502がらの処理を行う。
ブロック506からは第2候補の選択を行う。ブロック
506ではJlを除いて最大のスコアSJ2を持っカテ
ゴリJ2を求め、ブロック507でJ2に対する禁止則
チエツクをブロック503と同様に行い、ブロック50
8の判定で、RJ2がOで人力文字がJ2に列する禁止
特徴を持たなければJ2を第2候補として終了する。
RJ2が正でカテゴリJ2に対する禁止特徴を持てば、
ブロック509でカテゴリJ2を除いて、ブロック50
6に戻り再び第2候補の選択を行う。
次に、ブロック106でのりジェクト判定処理の流れを
第6図に従って説明する。ブロック601では、第1候
補のカテゴリJ1のスコアS、1、第2候補のカテゴリ
J2のスコヒアをS、2の差dをもとめる。
d=SJ1−8,2 として、ブロック602で判定をおこない、dがTh1
以上ならば、ブロック603に進み、第1候補のカテゴ
リJ0を認識結果として受理する。d′/J<Th1未
満ならば、ブロック604においてJlとJ2に応じた
局所構造抽出のためのパラメータを再設定し、認識処理
の再試行をおこなう。正解カテゴリではスコアが1でそ
れ以外ではスコアが−1となるように特徴軸を設定して
利用した場合には、Thlは0.8程度を用いる。パラ
メータの再設定では、JlとJ2の組合ぜ毎に認識処理
で用いるパラメータを再設定用に予め準備して表形式で
記憶しておき、認識結果のJlとJ2をキーとして表引
きをして、再設定用のパラメータ群を得る。手書き数字
認識処理において、第2図のブロック205で用いた4
つのしきい値t1〜t4の再設定を例にして説明すると
、しきい値(jl + t2. t3. t4)を初期
的に(1,2,0,2,−0,2,−1,2)設定する
が、Jが0でJ2が6、つまり第1候補が数字′0′で
第2候補が′6′の場合には、(t工、t2.t3.t
4)を(1,4,0,3,−0,3,−1,4)に再設
定し、ブロック102より認識処理の再試行を行う。こ
こでは、しきい値t1〜t4の再設定について述べたが
、他の認識処理で用いられるパラメータへの拡張も容易
に類推可能である。
(発明の効果) 以上の説明で明らかなように、本願発明においては、手
書き変動により消えがちな局所的な構造特徴を抽出し認
識に利用できるようにし、しかも位相構造変化に影響さ
れないようにしている。さらに、構造解析法の失意があ
る線の途切れや穴のつぶれによる構造の変化に影響され
て構造解析を誤るという問題点を除去し、位相構造の変
化にも影響されにくい認識処理を構成できる。また局所
構造の有無に基づき判別困難な類似文字の詳紺な認識を
可能にしている。文字の変形が著しく1回の認識処理で
は判別できないような文字の認識では、認識処理を再試
行することにより正しい認識が可能になる。このように
本願発明により、手書き変動を吸収でき正確な手書き文
字認識が可能となるだけでなく、多様な印刷文字の認識
も可能である。さらに、本願発明は多くのパターン認識
処理にも応用ができる。
【図面の簡単な説明】
第1図は本願発明の原理的な処理の流れ図、第2図は局
所構造解析の処理例の流れ図、第3図は文字の輪郭線の
例と抽出された局所構造の例を示す図、第4図は特徴ベ
クトル計算の手順の例を示す図、第5図はスコア計算と
禁止則チエツクの処理手順の例を示す図である。第6図
は認識処理の再試行を制御する手順の例を示す図である

Claims (1)

    【特許請求の範囲】
  1.  文字の輪郭線の形状から文字の特徴量を計算して認識
    処理を行う文字認識方法であって、文字画像の輪郭線の
    曲率に基づいて局所構造に分割し、文字を区切った小領
    域内での局所構造の種類及び方向別の局所構造を構成す
    る画素数を要素とした特徴ベクトルを求める特徴抽出手
    段と、カテゴリ毎の特徴ベクトルと入力文字の特徴ベク
    トルとからカテゴリ毎のスコアを計算する手段と、カテ
    ゴリ毎の禁止則と入力特徴ベクトルとからカテゴリ毎の
    禁止特徴の有無を判定する手段と、前記スコアと禁止特
    徴の有無の判定結果を統合して、認識結果を求める手段
    と、認識結果の評価値が低い場合を判定し、その場合に
    は前記特徴抽出で用いたパラメータを再設定して特徴抽
    出処理から再試行することを制御する手段を、備えたこ
    とを特徴とする文字認識方法。
JP63123147A 1988-05-20 1988-05-20 文字認識装置 Expired - Fee Related JP2976426B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP63123147A JP2976426B2 (ja) 1988-05-20 1988-05-20 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP63123147A JP2976426B2 (ja) 1988-05-20 1988-05-20 文字認識装置

Publications (2)

Publication Number Publication Date
JPH01292589A true JPH01292589A (ja) 1989-11-24
JP2976426B2 JP2976426B2 (ja) 1999-11-10

Family

ID=14853356

Family Applications (1)

Application Number Title Priority Date Filing Date
JP63123147A Expired - Fee Related JP2976426B2 (ja) 1988-05-20 1988-05-20 文字認識装置

Country Status (1)

Country Link
JP (1) JP2976426B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272335A (ja) * 2006-03-30 2007-10-18 Toshiba Corp 描画装置、形状データ生成装置、方法およびプログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007272335A (ja) * 2006-03-30 2007-10-18 Toshiba Corp 描画装置、形状データ生成装置、方法およびプログラム
JP4643485B2 (ja) * 2006-03-30 2011-03-02 株式会社東芝 描画装置、方法およびプログラム

Also Published As

Publication number Publication date
JP2976426B2 (ja) 1999-11-10

Similar Documents

Publication Publication Date Title
US7068843B2 (en) Method for extracting and matching gesture features of image
JP3343864B2 (ja) 語体の分離方法
JP3742279B2 (ja) 画像照合装置、画像照合方法及び画像照合プログラムを記録した記録媒体
US20040136591A1 (en) Method and device for recognition of a handwritten pattern
Chatbri et al. Using scale space filtering to make thinning algorithms robust against noise in sketch images
JPH02266485A (ja) 情報認識装置
JP2009129237A (ja) 画像処理装置及びその方法
CN115641615A (zh) 复杂背景下闭合手掌感兴趣区域提取方法
US7295707B2 (en) Method for aligning gesture features of image
JPH01292589A (ja) 文字認識装置
Adhan et al. Alphabetic hand sign interpretation using geometric invariance
JP3977473B2 (ja) 手書き文字認識方法及び手書き文字認識装置
Thuresson et al. Finding object categories in cluttered images using minimal shape prototypes
Babczyński et al. Direct Tensor Voting in line segmentation of handwritten documents
JP3115139B2 (ja) 文字切り出し方法
Chowdhury et al. Efficient fingerprint matching based upon minutiae extraction
Mazaheri et al. Fingerprint matching using an onion layer algorithm of computational geometry based on level 3 features
Boreki et al. Hand geometry feature extraction through curvature profile analysis
JP3198218B2 (ja) オンライン手書き文字認識方法
JP2856409B2 (ja) 文字認識装置および方法
JP3742312B2 (ja) 画像照合装置、画像照合方法、プログラム及び記録媒体
JP2851865B2 (ja) 文字認識装置
JP2865530B2 (ja) 指紋照合装置
JPH076211A (ja) オンライン文字認識装置
JP2824704B2 (ja) 文字認識装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees