JP2749946B2 - 文字認識方法 - Google Patents

文字認識方法

Info

Publication number
JP2749946B2
JP2749946B2 JP2100828A JP10082890A JP2749946B2 JP 2749946 B2 JP2749946 B2 JP 2749946B2 JP 2100828 A JP2100828 A JP 2100828A JP 10082890 A JP10082890 A JP 10082890A JP 2749946 B2 JP2749946 B2 JP 2749946B2
Authority
JP
Japan
Prior art keywords
character
value
pattern
coordinate
coordinates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2100828A
Other languages
English (en)
Other versions
JPH04587A (ja
Inventor
浩一 樋口
義征 山下
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2100828A priority Critical patent/JP2749946B2/ja
Publication of JPH04587A publication Critical patent/JPH04587A/ja
Application granted granted Critical
Publication of JP2749946B2 publication Critical patent/JP2749946B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、媒体上の文字を光電変換して得られる文字
パタンより、入力文字を認識する文字認識方法、特に高
速で、認識精度の良い文字認識方法に関するものであ
る。
(従来の技術) 従来、この種の文字認識方法としては特開昭58−1231
71号公報に記載されるものがあった。
従来、媒体上の文字を認識する場合、手書き文字にお
いては、筆者の違いによる線素の移動速度や傾き、印刷
文字においては、フォント(字体)の違い等により、抽
出される特徴が変動するので、該特徴の変動に対応した
辞書を用意しなければならなかった。そのため、辞書容
量が増大し、さらにその辞書の照合に要する時間も増大
し、処理速度の低下、装置の大型化を招いていた。
そこで、前記文献の技術では、文字パタンを水平方向
及び垂直方向に走査して周辺分布を求め、該周辺分布の
重心位置により分割座標を決定している。これにより、
文字パタン上の領域を決定するための分割位置を線素の
位置移動に追従させることが可能となり、個人差に基づ
くストローク位置変動等の特徴の変動を吸収し、辞書容
量の減少による処理速度の高速化を図るようにしてい
る。
(発明が解決しようとする課題) しかしながら、上記の文字認識方法では、次のような
課題があった。
第2図(a),(b)は従来の文字パタン分割方法を
説明するための図であり、同図(a)は傾きのない文字
の場合、及び同図(b)は斜体字の場合についてそれぞ
れ示されている。
従来の文字認識方法では、入力文字パタンの外接枠を
検出し、垂直な分割境界Sに基づきその外接枠内を複数
の領域に分割している。ところが、第2図(b)に示す
ように、垂直線素に傾きを持つような斜体字について垂
直な分割境界Sを定めた場合、第2図(a)に示すよう
な傾きのない文字の場合と比較すると、傾きのない文字
については垂直線素と平行に分割されるが、垂直線素に
傾きを持つ斜体字については文字線が斜めに分断されて
しまう。そのため、同じ文字でありながら、抽出される
特徴が大きく異なったものとなり、文字認識精度が低下
してしまう。このように、従来の文字認識方法において
は、垂直線素に傾きを持つような斜体字についてそれを
的確に分割する方法が無いため、そのような特徴の変動
を吸収するために、様々な変形に対応する辞書を用意せ
ざるをえなかった。そのため、辞書容量が増大し、照合
に時間がかかり、それによってハード規模(装置規模)
や処理時間が増大するという問題があり、未だ技術的に
十分満足のゆくものが得られなかった。
本発明は前記従来技術が持っていた課題として、処理
時間の増大と装置の大型化という点について解決した文
字認識方法を提供するものである。
(課題を解決するための手段) 本発明は前記課題を解決するために、媒体上の文字を
光電変換して得られる文字パタンの外接枠を検出し、該
外接枠内を複数の領域に分割し、該分割された分割領域
毎に特徴を抽出した後、該抽出された特徴と予め用意し
た標準特徴との照合により、前記文字を認識する文字認
識方法において、次のような手段を講じたものである。
即ち、前記文字パタンを含むX−Y座標系で定義され
る平面において、少なくとも2組の特定の実数α及びβ
について前記文字パタンの黒画素に関するαx+βy
(但し、x,yはX−Y座標系の座標値)の最大値及び最
小値を与える座標を求め、該座標に基づき前記文字パタ
ンの傾斜角を検出し、前記傾斜角に従って前記外接枠内
の分割境界を設定し、該分割境界に基づき前記外接枠内
を複数の領域に分割するようにしたものである。
(作 用) 本発明によれば、以上のように文字認識方法を構成し
たので、文字パタンが入力されると、その文字パタンに
対する外接枠を検出すると共に、該文字パタンの黒画素
に関するαx+βyの最大値及び最小値を与える座標を
検出し、その座標に基づき該文字パタンの傾斜角を検出
する。次に、検出された傾斜角に従って外接枠内の分割
境界を設定し、その設定された分割境界に基づき外接枠
内を複数の領域に分割する。その後、分割された分割領
域毎に特徴を抽出し、その特徴と標準特徴との照合を行
えば、入力文字の認識が行える。
このように、文字パタンの傾斜角を検出してその傾斜
角に基づき分割境界を設定しているので、垂直軸に対し
て傾斜するような文字パタンについても、抽出される特
徴が安定となるので、文字傾斜の変形に対応した辞書を
用意する必要がない。それにより、処理速度の高速化と
装置の小型化、及び認識精度の向上が図れる。従って、
前記課題を解決できるのである。
(実施例) 第1図は、本発明の実施例を示すもので、文字認識方
法を説明するための文字認識装置の機能ブロック図であ
る。
この文字認識装置は、帳票等の媒体上の文字画像の光
信号INを量子化された電気信号(ディジタル信号)に変
換する光電変換部1を有し、その出力側には、行バッフ
ァ2が接続されている。行バッファ2は、例えば幅2048
×高さ128ビットの大きさを有し、1行分の文字画像の
ディジタル信号を格納する構成になっており、その出力
側には、文字切出部3を介してパタンレジスタ4が接続
されている。
文字切出部3は、行バッファ2の出力から1文字分の
ディジタル信号(これを、「文字パタン」という)をパ
タンレジスタ4に格納する機能を有している。パタンレ
ジスタ4は、例えば64×64ビットの記憶容量を有し、そ
の出力側には、文字枠検出部5、線幅測定部6、及びサ
ブパタン抽出部7が接続されると共に、文字傾斜検出部
8が接続されている。
文字枠検出部5は、パタンレジスタ4内の文字パタン
を走査して外接枠、つまり文字枠を検出し、その検出結
果を文字傾斜検出部8等に与える機能を有している。線
幅測定部6は、パタンレジスタ4の出力に対する線幅を
測定し、その測定結果をサブパタン抽出部7に与える機
能を有している。サブパタン抽出部7は、パタンレジス
タ4を複数方向に走査して垂直、水平、右斜め、左斜め
サブパタンを抽出するもので、垂直サブパタン抽出部7
a、水平サブパタン抽出部7b、右斜めサブパタン抽出部7
c、及び左斜めサブパタン抽出部7dより構成されてい
る。各抽出部7a〜7dは、それぞれパタン格納用のメモリ
を有している。
文字傾斜検出部8は、パタンレジスタ4に格納された
文字パタンについて傾斜度を抽出する機能を有してい
る。文字枠検出部5の出力側には、分割点検出部9が接
続され、その分割点検出部9、文字枠検出部5、サブパ
タン抽出部7及び文字傾斜検出部8の出力側には、特徴
マトリクス抽出部10が接続され、さらにその出力側に識
別部11が接続されている。
分割点検出部9は、外接枠内を複数の部分領域に分割
するための分割点座標を検出する機能を有している。特
徴マトリクス抽出部10は、サブパタン抽出部7から出力
される垂直、水平、右斜め、及び左斜めサブパタンの各
パタンから、特徴量を抽出して特徴マトリクスを作成
し、それを識別部11へ与える機能を有している。識別部
11は、標準文字の特徴マトリクス(標準文字マスク)G
(k)と、この特徴マトリクスG(K)を有する標準文
字の文字名とを、格納する辞書メモリを有している。そ
して、特徴マトリクス抽出部10で抽出された特徴マトリ
クスF(k)と、辞書メモリの特徴マトリクスG(k)
とを、照合することにより、該特徴マトリクスF(k)
を得た外接枠内領域の文字図形の認識を行い、文字名OU
Tを出力する機能を有している。
第3図は、第1図の文字傾斜検出部8における一構成
例を示す機能ブロック図である。
この文字傾斜検出部8は、パタンレジスタ4から入力
される画像データMの画素にX座標を付与するためのX
座標発生手段21と、画像データMの画素にY座標を付与
するためのY座標発生手段22とを備え、それらの出力側
には座標検出手段30,40が接続されている。座標検出手
段30,40は、X、Y座標と少なくとも2組の特定のα値
及びβ値とを用いて被抽出パタンの画素に関する最大及
び最小の計算値αx+βyを検出し、その最大最小計算
値を与える被抽出パタンの画素のX、Y座標をそれぞれ
特徴点座標として出力するものであり、その出力側に
は、文字パタンの傾斜度を特徴点特徴に基づき算出する
傾斜度算出手段50が接続されている。
座標検出手段30は、計算値αx+βyを算出するX+
Y計算手段31と、最大計算値を検出するための最大値検
出手段32と、最大計算値を与える画素をX、Y座標を保
存するための最大値座標保存手段32と、最小計算値を検
出するための最小値検出手段34と、最小計算値を与える
画素のX、Y座標を保存するための最小値座標保存手段
35とで、構成されている。同様に、座標検出手段40は、
X−Y計算手段41、最大値検出手段42、最大値座標保存
手段43、最小値検出手段44、及び最小値座標保存手段45
より構成されている。
この文字傾斜検出部8では、特徴点座標検出のため
に、例えばα=β=1及びα=1、β=1の2組のα値
及びβ値を用いるので、2つの座標検出手段30,40を備
えている。一方の座標検出手段30では計算値X+Yに関
する最大及び最小計算値を、他方の座標検出手段40では
計算値X−Yに関する最大及び最小計算値を、それぞれ
与える画素の座標を検出する機能を有している。
例えば、X+Y計算手段31は加算回路で、X−Y計算
手段41は減算回路で、検出手段32,34,42,44はそれぞれ
比較器及びレジスタで、座標保存手段33,35,43,45はそ
れぞれレジスタ等で構成されている。また、X座標発生
手段21及びY座標発生手段22は、座標検出手段30,40に
対して共通に用いるように構成されており、そのため座
標検出手段30,40はX座標発生手段21及びY座標発生手
段22から出力されるX、Y座標をそれぞれ入力して特徴
点座標の検出を行う機能を有している。
次に、以上のように構成される文字認識装置を用いた
文字認識方法について、各機能ブロックの処理(I)〜
(VII)について説明する。
第4図は、印刷文字の斜体字の例を示す図である。本
実施例では、この第4図に示すように、印刷文字におけ
る斜体字のような、文字の垂直軸が傾斜するような文字
を含む文字列を認識する場合について、以下説明する。
(I) 文字パタン生成処理 帳票上に記入された文字画像の光信号INが光電変換部
1に入力されると、光電変換部1では、光信号INを2値
のデジタル信号、つまり文字線部を‘1'、背景部‘0'に
変換する。光電変換部1で変換された1行分の文字画像
のデジタル信号は、行バッファ2に格納される。
文字切出部3では、行バッファ2に格納された文字画
像のデジタル信号から、1文字分のデジタル信号(文字
パタン)を読出し、パタンレジスタ4に格納する。本実
施例では、帳票フォーマットが予め指定されており、文
字切出部3にメモリを有し、行バッファ2内の文字位置
を示すアドレスが格納されている。そのため、文字切出
し動作は、該アドレスで指定された行バッファ2の内容
を読み出すことにより実行される。
(II) 文字枠検出・線幅測定処理 文字枠検出部5では、パタンレジスタ4のパタンを走
査してそのパタンの左端座標Xl、右端座標Xr、上端座標
Yt及び下端座標Ybを検出する。外接枠、つまり文字枠は
(Xl,Yt)、(Xl,Yb)、(Xr,Yt)、(Xr,Yb)の4点を
結ぶ矩形枠となる。
また、文字枠検出後は、特徴量の正規化を行うため
に、必要な文字枠の大きさを算出する。即ち、パタンレ
ジスタ4のX軸に対し、平行な方向(水平方向)の文字
枠の大きさをWPhとしてWPh=Xr−Xl+1を、垂直な方向
(垂直方向)の文字枠の大きさをWPvとしてWPv=Yt−Yb
+1を、それぞれ算出する。さらに、右斜め及び左斜め
45゜方向の文字枠の大きさをWPr及びWPlとして を算出する。
一方、線幅測定部6では、パタンレジスタ4からのデ
ィジタル信号を入力し、例えば2×2の窓の全ての点が
黒ビットとなる状態の個数Qと、全黒ビットの個数Aと
を計数し、従来周知の(1)式に従って線幅LWを算出す
る。
WL=A/(A−Q) ……(1) (III) サブパタン抽出処理 サブパタン抽出部7では、垂直サブパタン抽出部7a、
水平サブパタン抽出部7b、右斜めサブパタン抽出部7c及
び左斜めサブパタン抽出部7dにより、それぞれパタンレ
ジスタ4上に設定したX軸方向に垂直な方向(垂直方
向)及び平行な方向(水平方向)と、X軸から反時計方
向45゜の方向(右斜め45゜方向)及び時計方向45゜の方
向(左斜め45゜方向)とを、主走査方向としてパタンレ
ジスタ4を走査し、各走査方向に対応する垂直、水平、
右斜め及び左斜めサブパタンを抽出する。
即ち、垂直サブパタン抽出部7aでは、垂直方向を主走
査方向として原パタンを全面走査し、垂直方向の走査線
上で連続する黒ビット(黒ラン)を検出する。そして、
検出した黒ランのなかから次式(2)を満足する長さl
の黒ランを抽出する。
l≧N・WL ……(2) 但し、l;主走査方向における黒ランの長さ N;各サブパタンに対する任意定数(例えば、
2) 次に、垂直サブパタン抽出部7aは、(2)式を満足す
る黒ランを、サブパタンを構成する黒ランとみなして図
示しない垂直サブパタンメモリに格納する。(2)式を
満足しない黒ランは白ビットとみなす。
同様に、水平、右斜め及び左斜めサブパタン抽出部7
b,7c,7dは、水平、右斜め及び左斜め方向を主走査方向
として原パタンを走査し、それぞれの主走査方向の走査
線上の黒ランのなかから、(2)式を満足する黒ランを
抽出し、抽出した黒ランを、サブパタンを構成する黒ラ
ンとみなし図示しない水平、右斜め及び左斜めサブパタ
ンメモリに格納する。
(IV) 文字傾斜検出処理 文字傾斜検出部8は、パタンレジスタ4に格納された
文字パタンについて傾斜度を抽出する。この抽出方法
を、第3図、第5図(a),(b)及び第6図(a),
(b)を参照しつつ説明する。
第5図(a),(b)は傾斜度検出方法を説明するた
めの特徴点の検出例を示す図である。X−Y座標系で表
現される表面には、被抽出パタンM2である傾きのない文
字(第5図(a))と斜体字(第5図(b))とが示さ
れている。BL,BR,TL,TRは特徴点である。第6図
(a),(b)は、文字傾斜検出方法を説明するもの
で、同図(a)は最大値処理のフローチャート、及び同
図(b)は最小値処理のフローチャートである。
この文字傾斜検出処理を、(A)特徴点TL、BR座標の
検出処理と、(B)特徴点BL、TR座標の検出処理と、
(C)傾斜度算出処理とに分けて以下説明する。
(A)特徴点TL、BR座標の検出処理 この処理では、第3図の座標検出手段30等により、次
のような(1)〜(5)の処理ステップで実行される。
(1) ステップS1〜S3 先ず、パタンレジスタ4の走査を開始し、そのパタン
レジスタ4より出力された画像データMを、文字傾斜検
出部8に入力する(ステップS1)。
この画像データMは、画素毎に座標検出手段30内の最
大値検出手段32及び最小値検出手段34に入力される。
これと共に、X座標発生手段21及びY座標発生手段22
は、画像データMの出力と同期させて、この画像データ
Mの各画素毎に対応付けたX、Y座標を発生する。その
結果、これら発生手段21,22により、画像データMに
X、Y座標の付与が行われる。そして出力されたX、Y
座標は、座標検出手段30内のX+Y計算手段31、最大値
座標保存手段33、及び最小値座標保存段35に入力される
(ステップS2)。
X+Y計算手段31はX、Y座標を入力すると、これら
X、Y座標から計算値X+Yを算出し、算出した計算値
を最大値検出手段32及び最小値検出手段34へ出力する
(ステップS3)。ステップS2〜S3によって、最大値検出
手段32は画像データM及び計算値を、最小値検出手段34
は画像データM及び計算値を、最大値座標保存手段33は
X、Y座標を、最小値座標保存手段35はX、Y座標を、
それぞれ1画素毎に入力する。そして、座標検出手段30
は、後述のステップS4、S5a、S5b或いはS7の判断を1画
素毎に繰り返し実行し、その判断結果に応じた処理を行
う。
(2) ステップS4 最大値検出手段32及び最小値検出手段34は、入力され
た画像データMの画像が所定の画素値(例えば、‘1')
であるか否かを判断する。
所定の画素値を有さないとき 最大値検出手段32及び最小値検出手段34は、格納して
いる比較値を書換えず、これと共に最大値座標保存手段
33及び最小値座標保存手段35も、格納されているX、Y
座標を書換えない。検出手段32,34は、ステップS4の次
に、ステップS7の判断を行う。
所定の画素値を有するとき 最大値検出手段32はステップS4の次に比較値及び計算
値の比較(ステップS5a)を、最小値検出手段34はステ
ップS4の次に比較値及び計算値の比較(ステップS5b)
を、それぞれ行う。
(3) ステップS5a このステップでは、計算値が比較値より大きいか否か
を判断し、その判断結果に応じた次のような処理を実行
する。
計算値>比較値のとき 最大値検出手段32は、先に格納されている比較値に代
えて、比較値よりも大きい計算値を新たな比較値として
格納し(比較値の書換え)、これと共にセットパルスを
最大値座標保存手段33へ出力する。セットパルスを入力
した最大値座標保存手段33は、格納されているX、Y座
標に代えて、比較値よりも大きな計算値を与える画素の
X、Y座標を新たに格納する(「X、Y座標の書換え」
ステップS6)。
計算値≦比較値のとき 最大値検出手段32は、先に格納されている比較値を書
換えずにそのまま格納すると共に、最大値座標保存手段
33も、格納されているX、Y座標を書換えない。
最大値検出手段32は、前記及びのいずれの場合、
ステップS5aの次に、ステップS7の判断を行う。
なお、最大値検出手段32に格納される比較値の初期値
としては、例えば計算値αとして取り得る値よりも小さ
な値を用いれば良い。例えば、α=β=1で、画像デー
タMをl行m列の画素に分割した(従って、0≦Xm−
1、及び0≦Y≦l−1となる)場合には、−1を比較
値の初期値とすることができる。或は比較値の初期値と
して、最大値検出手段32に一番最初に入力された計算値
αx+βyを用いるようにしても良い。
また、最大値検出手段32は、比較値及びX、Y座標の
書換えを、計算値αx+βyが比較値よりも大きいと
き、及び計算値が比較値と等しいときに行うようにし、
これと共に計算値が比較値よりも小さいとき、比較値及
びX、Y座標の書換えを行わないようにしても良い。さ
らに、最大値座標保存手段33のX、Y座標としては、任
意好適な数値を用いて良い。
(4) ステップS5b 第6図(b)のステップS5bでは、計算値が比較値よ
り小さいか否かの判断を行い、その判断結果に基づき次
のような処理を実行する。
計算値<比較値のとき 最小値検出手段34は、先に格納されている比較値に代
えて、比較値よりも小さい計算値を比較値として新たに
格納する(比較値の書換え)と共に、最小値座標保存手
段35へセットパルスを出力する。最小値座標保存手段35
は、セットパルスを入力すると、格納されているX、Y
座標を、比較値よりも小さな計算値を与える画素をX、
Y座標に書換える(「X、Y座標の書換え」ステップS
6)。
計算値≧比較値のとき 最小値検出手段34は、先に格納されている比較値を書
換えずにそのまま格納すると共に、最小値座標保存手段
35も、格納されているX、Y座標を書換えない。
最小値検出手段34は、前記及びのいずれの場合に
も、ステップS5bの次に、ステップS7の判断を行う。
なお、最小値検出手段34に格納される比較値の初期値
としては、例えば計算値αax+βyとして取り得る値よ
りも大きな値を用いれば良い。例えば、α=β=1で、
画像データMをl行m列の画素に分割した(従って、0
≦Xm−1、及び0≦Y≦l−1となる)場合には、m+
n−1を比較値の初期値とすることができる。或は比較
値の初期値として最小値検出手段34に一番最初に入力さ
れた計算値αx+βyを用いるようにしても良い。
また、最小値検出手段34は、計算値が比較値よりも小
さいとき、及び計算値が比較値と等しいとき、比較値及
びX、Y座標の書換えを行い、これと共に計算値が比較
値よりも大きいとき、比較値及びX、Y座標の書換えを
行わないようにしても良い。さらに、最小値座標保存手
段35のX、Y座標としては、任意好適な数値を用いて良
い。
(5) ステップS7 ステップS7では、画像データMの走査を終了したか否
かを判断し、その判断結果に応じて次のような処理を実
行する。
画像データMの走査を終了したとき 最大値検出手段32及び最小値検出手段34は、画像デー
タMの走査が終了し、データMの全画素につき処理が終
了すると、X、Y座標の出力信号を、最大値座標保存手
段33及び最小値座標保存手段35へ出力する。すると、座
標保存手段33,35は、格納しているX、Y座標を特徴点
座標として出力する。これと共に検出手段32,34は、比
較値の初期化を行う(ステップS8)。
全画素につき処理を終了した時点で、最大値座標保存
手段33及び最小値座標保存手段35に格納されているX、
Y座標が、最大及び最小計算値を与える画素のX、Y座
標、すなわち特徴点座標となる。
座標検出手段30では、α=β=1としたので、全処理
終了時点で、例えば第5図に示す被抽出パタンM2の特徴
点BRの座標が、最大値座標保存手段33に格納されてお
り、また特徴点TLの座標が、最小値座標保存手段35に格
納されている。
画像データMの走査が終了しないとき 座標検出手段30は、画像データMの走査が終了せず、
従ってデータMの全画素につき処理が終了していなけれ
ば、画像データMの残りの画素につき、ステップS4,S5
a,S5b或はS7の判断を行い、その判断結果に応じた処理
を行う。
(B)特徴点BL、TR座標の検出処理 この処理では、座標検出手段40等で行われる処理であ
る。即ち、座標検出手段40は、上述した座標検出手段30
の動作と並行してその座標検出手段30とほぼ同様の処理
を行う。
この座標検出手段40では、α=1及びβ=1としたの
で、全画素につき処理を終了した時点で、例えば、第5
図に示す被抽出パタンM2の特徴点TRの座標が、最大値座
標保存手段43に格納されており、また特徴点BLの座標
が、最小値座標保存手段45に格納されている。
(C)傾斜度算出処理 前記処理(A),(B)で、特徴点TR,TL,BR,BLの4
点の座標(TRx,TRy),(TLx,TLy),(BRx,BRy),(B
Lx,BLy)が検出されると、傾斜度算出手段50では、該4
点の座標より、入力文字パタンの傾斜角度に相当する値
(傾斜度)THを次式に従って計算する。
即ち、傾斜度算出手段50は、(3)式を用いて、4個の
特徴点を結んで得られる四辺形の右辺の上端と下端のx
座標値の差と、左辺の上端と下端のx座標値の左の平均
を、文字高さの平均で割った値を傾斜度TH(但し、TH;
実数)として出力し、特徴マトリクス抽出部10へ与え
る。
(V) 分割点検出処理 分割点検出部9では、外接枠内領域をNX×NY個の部分
領域に分割するためのX軸上及びY軸上の分割点座標
を、各外接枠毎に決定する。但し、NXはX軸方向におけ
る分割数、及びNYはY軸方向における分割数である。
分割数NX及びNYは、文字の複雑さに応じて任意好適な
値に設定するのが好ましい。例えば、漢字・カタカナ等
の画数の少ない文字を認識対象とする場合は、(2×
2)〜(3×3)程度の少ない数の部分領域に、外接枠
内領域を分割する。漢字が認識対象となる場合には、
(4×4)〜(8×8)程度の部分領域に、外接枠内領
域を分割することが多い。しかし、本実施例では、認識
対象の複雑さにかかわらず、外接枠内領域を等分割、例
えば(4×4)個に分割するようにした。
X軸上の分割座標DX(n)、及びY軸上の分割座標DY
(n)は、次式(4),(5)で決定される。
但し、n=1,2,……,NX−1 m=1,2,……,NY−1 本実施例では、例えば NX=NY=4 (VI) 特徴マトリクス抽出処理 文字枠検出部5が文字パタンの外接枠を規定する座標
Xl,Xr,Yt,Ybを検出し、さらに分割点検出部9が文字パ
タンについて対象分割点座標を検出すると、特徴マトリ
クス抽出部10では、垂直、水平、右斜め、及び左斜めサ
ブパタンの各パタンから特徴量を抽出し、特徴マトリク
スを作成する。
即ち、特徴マトリクス抽出部10は、一つの外接枠内領
域を、対象分割点座標とl座標Xl,Xr,Yt,YbとによってN
X×NY個の部分領域に分割し、各部分領域内のサブパタ
ンの文字線量を表す特徴量を抽出する。そして、一つの
外接枠領域内の各サブパタンから抽出したNX×NY×4個
の特徴量から成る特徴マトリクスを、当該外接枠内領域
の特徴量マトリクスとして抽出する。
まず、水平サブパタン(HSP)からの特徴量抽出につ
き説明する。
特徴マトリクス抽出部10は、対象分割点座標と座標X
l,Xr,Yt,Ybとに基づき、外接枠内領域をNX×NY個の部分
領域に分割し(対象分割点座標及び座標Xl,Xr,Yt,Ybは
分割点座標である)、各部分領域毎に部分領域内の水平
サブパタンHSPの黒ビット数BH(i,j)を計数する。
分割点座標から分割領域の決定は、次のように行う。
まず、X軸上の分割点座標DX(n)を、文字パタンの外
接枠の上端と下端の中点を通りX軸に平行な直線上に設
定する。この座標を起点として、次式(6)〜(8)で
求められる座標系列の左側を分割境界Sとする。この分
割境界Sの例を第7図に示す。
x0=DX(n) y0=(YT+YB)/2 ……(6) (x0,y0)から、下方への座標系列は、 xi=DX(n) −INT{TH×(yi−y0)+0.5} yi=yi-1+1 ……(7) 但し、i=1,2,3,…, {(TY−YB)/2−YT} (x0,からy0)から、上方への座標系列は、 xj=DX(n) +INT{TH×(y0−yj)+0.5} yj=yj+1−1 ……(8) 但し、j=−1,−2,−3,……, −{YB−(YT−YB)/2} で求める。但し、INT{ }は、その{ }内の演算を
実数値を用いて行い、結果の小数点以下を切捨てて、整
数値とすることを表す。
水平方向の分割境界Sは、DY(m)より、水平方向に
設定する。
以上のように分割された分割領域毎に、水平サブパタ
ンHSPの黒ビット数BH(i,j)を計数する。このBH(i,
j)は、一つの外接枠内領域に関する第i行第j列の部
分領域の黒ビット数である。次に、(9)式に従って第
i行第j列の部分領域に関する特徴量FH(i,j)を計算
する。
但し、i=1,2,……,NX j=1,2,……,NY WL;線幅 WPh;文字幅(=Xr−Xl+1) さらに、HSPの場合と同様にして、第i行第j列の部
分領域のVSP,RSP,LSPの黒ビット数BV(i,j),BR(i,
j),BL(i,j)を計数し、次式(10)〜(12)に従って
i行第j列の部分領域に関するVSP,RSP,LSPの特徴量FV
(i,j),FR(i,j),FL(i,j)を算出する。
但し、 WPv;文字高さ(=Yb−Yt+1) WPr=WPl=(WPv+WPh)/2 以上のようにして、外接枠内領域の各部分領域毎にVS
P,HSP,RSP,LSPの特徴量を抽出し、これらNX×NY×4個
の特徴量から成る特徴マトリクスF(k)(k=1,2,…
…,NX×NY×4)を得る。特徴マトリクス抽出部10は、
特徴マトリクスF(k)を各外接枠領域毎に抽出し、そ
の抽出結果を識別部11へ送る。
(VII) 識別処理 識別部11は、抽出された特徴マトリクスF(k)と、
内部に設けられた辞書メモリ内の特徴マトリクスG
(k)とを、照合することにより、該特徴マトリクスF
(k)を得た外接枠内領域の文字図形の認識を行う。こ
の認識では、次式(13)に従って特徴マトリクス(k)
とG(k)間の距離Dを求め、距離Dが最小となる特徴
マトリクスG(k)の標準文字の文字名(例えば、JIS
規格に定められた文字コード)OUTを認識結果として出
力する。
以上のように、本実施例では、次のような利点を有し
ている。
(a) 本実施例では、パタンレジスタ4内の文字パタ
ンを含むX−Y座標系で表現される平面において、文字
パタンの黒画素に関するαx+βyの最大値及び最小値
を与える座標を文字傾斜検出部8で検出し、さらにその
座標に基づき文字パタンの傾斜角を検出する。そして、
特徴マトリクス抽出部10で、該傾斜角に従って分割境界
を設定し、特徴マトリクスを抽出している。そのため、
傾斜を有する文字パタンについても、抽出される特徴が
不安となり、文字傾斜の変形に対応した辞書を識別部11
内に用意する必要がない。従って、辞書容量の減少によ
り、照合時間の短縮と、それによる処理速度の高速化が
図れると共に、ハード規模が小さく、認識精度の良い文
字認識方法を提供できる。
(b) 上記実施例では、第4図のような印刷文字にお
ける斜体字の認識方法について説明したが、認識対象文
字は、これに限定されない。例えば、手書き間初の癖字
で、右上がりに記入された文字を認識対象とする場合
は、文字の水平軸が傾斜しているものとして、上記実施
例とほぼ同様の処理で認識することができる。
なお、本発明は、上記実施例に限定されず、例えば第
3図の文字傾斜検出部8を、他の機能ブロックで構成し
たり、あるいはそれらの機能ブロックを、コンピュータ
を用いたプログラム制御等で実行する構成にしてもよ
い。さらに、その文字傾斜検出処理を、第6図(a),
(b)以外の処理フローチャートで実行する等、種々の
変形が可能である。
(発明の効果) 以上詳細に説明したように、本発明によれば、文字パ
タンを含むX−Y座標計で表現される平面において、α
x+βyの最大値及び最小値を与える座標を求め、その
座標に基づき文字パタンの傾斜角を検出する。次に、そ
の傾斜角に従って文字外接枠内の分割境界を設定し、そ
の分割境界で分割された領域毎に、特徴を抽出するよう
にしている。そのため、傾斜を有する文字パタンについ
ても、抽出される特徴が安定となり、文字傾斜の変形に
対応した辞書を用意する必要がない。これにより、辞書
容量の減少と、それによる照合時間の短縮化によって処
理速度の高速化が図れると共に、小さなハード規模で、
認識精度の良い文字認識方法が実現できる。
【図面の簡単な説明】
第1図は本発明の実施例を示すもので、文字認識方法を
説明するための文字認識装置の機能ブロック図、第2図
は従来の文字パタン分割方法を説明するための図、第3
図は第1図における文字傾斜検出部の機能ブロック図、
第4図は斜体字の例を示す図、第5図(a),(b)は
傾斜度検出方法を説明するための特徴点の検出例を示す
図、第6図(a),(b)は文字傾斜検出のフローチャ
ート、第7図は分割境界の例を示す図である。 1……光電変換部、2……行バッファ、3……文字切出
部、4……パタンレジスタ、5……文字枠検出部、6…
…線幅測定部、7……サブパタン抽出部、8……文字傾
斜検出部、9……分割点検出部、10……特徴マトリクス
抽出部、11……識別部、21……X座標発生手段、22……
Y座標発生手段、30,40……座標検出手段、50……傾斜
度算出手段。
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 昭60−3078(JP,A) 特開 昭63−238686(JP,A) 特開 昭60−201485(JP,A) 特開 平4−588(JP,A) 特開 平4−590(JP,A) 特開 昭57−196383(JP,A)

Claims (1)

    (57)【特許請求の範囲】
  1. 【請求項1】媒体上の文字を光電変換して得られる文字
    パタンの外接枠を検出し、該外接枠内を複数の領域に分
    割し、該分割された分割領域毎に特徴を抽出した後、該
    抽出された特徴と予め用意した標準特徴との照合によ
    り、前記文字を認識する文字認識方法において、 前記文字パタンを含むX−Y座標系で定義される平面に
    おいて、少なくとも2組の特定の実数α及びβについて
    前記文字パタンの黒画素に関するαx+βy(但し、x,
    yはX−Y座標系の座標値)の最大値及び最小値を与え
    る座標を求め、該座標に基づき前記文字パタンの傾斜角
    を検出し、 前記傾斜角に従って前記外接枠内の分割境界を設定し、
    該分割境界に基づき前記外接枠内を複数の領域に分割す
    ることを特徴とする文字認識方法。
JP2100828A 1990-04-17 1990-04-17 文字認識方法 Expired - Lifetime JP2749946B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2100828A JP2749946B2 (ja) 1990-04-17 1990-04-17 文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2100828A JP2749946B2 (ja) 1990-04-17 1990-04-17 文字認識方法

Publications (2)

Publication Number Publication Date
JPH04587A JPH04587A (ja) 1992-01-06
JP2749946B2 true JP2749946B2 (ja) 1998-05-13

Family

ID=14284187

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2100828A Expired - Lifetime JP2749946B2 (ja) 1990-04-17 1990-04-17 文字認識方法

Country Status (1)

Country Link
JP (1) JP2749946B2 (ja)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS603078A (ja) * 1983-06-21 1985-01-09 Oki Electric Ind Co Ltd 文字認識方法
JPH0656625B2 (ja) * 1987-03-26 1994-07-27 沖電気工業株式会社 特徴抽出方式

Also Published As

Publication number Publication date
JPH04587A (ja) 1992-01-06

Similar Documents

Publication Publication Date Title
US4408342A (en) Method for recognizing a machine encoded character
JPH08508128A (ja) 分布マップを用いる画像の分類方法及び装置
JP2749946B2 (ja) 文字認識方法
JP2749947B2 (ja) 文字認識方法
JP2616994B2 (ja) 特徴抽出装置
JPH0896072A (ja) ページ傾き検出方法
JPH04589A (ja) 特徴抽出方法
JP2626084B2 (ja) 文字認識装置
JP2827288B2 (ja) 文字認識装置
JPH04590A (ja) 文字認識方法
JP2980636B2 (ja) 文字認識装置
JPH0147829B2 (ja)
JP2708604B2 (ja) 文字認識方法
JPH0656625B2 (ja) 特徴抽出方式
JPH0821060B2 (ja) 特徴抽出方法及び特徴抽出装置
JPH0656624B2 (ja) 特徴抽出方式
JP2616995B2 (ja) 文字認識装置
JPH0310389A (ja) 文字認識装置
JPH0833908B2 (ja) 特徴抽出方法
JPH0821061B2 (ja) 特徴抽出方法及び特徴抽出装置
JPH01152586A (ja) 文字図形認識方法
JPH04591A (ja) 特徴抽出方法
JPH0547871B2 (ja)
JPH0821062B2 (ja) 特徴抽出方法及び特徴抽出装置
JPH06348902A (ja) 文字認識装置