JPH0310389A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH0310389A
JPH0310389A JP1144201A JP14420189A JPH0310389A JP H0310389 A JPH0310389 A JP H0310389A JP 1144201 A JP1144201 A JP 1144201A JP 14420189 A JP14420189 A JP 14420189A JP H0310389 A JPH0310389 A JP H0310389A
Authority
JP
Japan
Prior art keywords
character
matrix
pattern
black
sub
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1144201A
Other languages
English (en)
Inventor
Hirohisa Goto
後藤 裕久
Koichi Higuchi
浩一 樋口
Yoshiyuki Yamashita
山下 義征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP1144201A priority Critical patent/JPH0310389A/ja
Publication of JPH0310389A publication Critical patent/JPH0310389A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 (産業上の利用分野) 本発明は、文字図形を光学的に読取って認識する文字認
識装置に関する。
(従来の技術) 従来、例えば文字図形認識装置に於ては、紙面等から読
取られた文字図形パターンよりその文字等を構成するス
トロークを抽出し、それら抽出されたストロークの位置
、長さ、ストローク間の相互関係等を用いて文字等を認
識する方法が多く採用されていた。
例えばその第1の手法においては、文字図形パターンの
輪郭を追跡することにより検出された輪郭点系列(座標
値の集合)についてその曲率を計算し、曲率の大きな値
の点を分割点として輪郭点系列を分割し、分割された系
列を組合わせることによりストロークを抽出し、そのス
トロークについて幾何学的な特徴等を抽出して標準文字
マスクと照合し、文字図形を認識するようにしていた。
又、第2の手法においては、文字図形パターンの細線化
処理を行なって骨格化し、その骨格パターンの連結性及
び骨格パターンを追跡し、急激な角度の変化点等を検出
してストロークを抽出し、そのストロークについて第1
の手法と同様に幾何学的な特徴等を抽出して文字図形の
認識を行なっていた。
しかしながら上記第1の手法は、文字図形パターンのデ
ータ量が大きくなり、又文字図形パターンが複雑化する
と、その処理量が増大し処理速度の低下を招く欠点があ
った。
又、第2の手法は、文字図形パターンを細線化する必要
があり、その細線化によるパターンのひずみ、屈曲点等
における不要なヒゲの発生等の問題があり、その後の処
理を複雑なものとしていた。
このような問題を解決するために、本出願人は、先の出
願(特開昭62−154079号公報)により、以下の
(a)から(f)の手順に従って文字図形パターンの特
徴抽出を行なう方法を提案している。
第2図(a)〜(e)にその構成を図解した。
(A)先ず、紙面等に記載された文字図形パターンをイ
メージラインセンサ等で読取り、光電変換して量子化す
ることにより、黒ビット及び白ビットで表わされるディ
ジタル信号の原パターン21を作成する[第2図(a)
]。
(B)次に、その原パターン中の文字図形の線幅Wを算
出する。
(C)次に、文字に外接する文字枠22により文字を取
り囲む。そして、その文字枠内領域において、原パター
ン21について複数の方向(例えば縦、横、斜め方向)
に第1の走査(それぞれ全面走査)を行なって、各方向
の走査について各走査列毎の黒ビットの連続個数を検出
する。次に、当該黒ビットの連続個数と前記線幅Wとに
基づいて、第1の走査の、上記走査方向毎に、対応した
複数のサブパターン(VSP、H3P、H3P。
LSP)を抽出する。
具体的には、第2図(a)の原パターンから、縦方向の
ストローク、横方向のストローク、斜め方向のストロー
クのみをそれぞれ抽出して、これらをもとに、サブパタ
ーン23a〜23dを得ることを意味する[第2図(b
)]。
(D)次に、上記原パターン21の文字枠内領域を上記
各サブパターン毎に(NxM)個の領域(N、Mは整数
、図の例ではM=N=5)に分割し、更に各サブパター
ンの抽出の際に走査した第1の走査の方向と所定の角度
(例えば90°)を成す方向にそれぞれ第2の走査を行
ない、白ビットから黒ビット、黒ビットから白ビットへ
変化したときの黒ビットの座標位置を基に線長マトリク
スを作成する。
具体的には、第2図(b)の垂直サブパターン(vsp
)中に例示したように、第2の走査27を行なったとき
、線28との交叉部分の中点29を求める。そして、そ
の中点29が存在する線長マトリクス上のデータに°1
″′を加算する。例えば100X 100画素構成の各
サブパターンの全画素について第2の走査を行なえば、
各分割領域でそれぞれ20個の中点が検出されるから、
その分割領域を一端から他端まで通過する線についての
特微量は、それぞれ“’20”となる。分割領域内で終
端する線についての特徴量は、その領域内における線長
に応じた値となる。その結果、例えば第2図(C)のよ
うな線長マトリクス24a〜24dを得る。
(E)次に、その線長マトリクスを文字の大きさで正規
化して特徴マトリクスを作成する。
具体的には、標準文字図形パターンについて用意された
標準マトリクスとこの線長マトリクスを比較する前に、
原パターン21の縦横比やサイズを標準文字図形のそれ
に近づけるための補正演算を行なう。
(F)こうして得られた特徴マトリクス25を、予め用
意した文字図形パターンの標準マトリクスと照合して文
字図形を認識する。
(発明が解決しようとする問題点) ところで、文字図形パターンを光電変換するイメージセ
ンサの分解能の不足や、文字図形パターンそのものの画
像のボケ等により、実質的に読み取られる文字図形パタ
ーンが、つぶれてしま、う現象がある。
第3図(a)はつぶれていない原パターンを示し、同図
(b)はつぶれてしまった原パターンを示したものであ
る。
先に説明したような、各サブパターンを走査して得られ
る白ビットから黒ビット、又は黒ビットから白ビットに
変化するときの変化点を基にして線長マトリクスを作成
する方法では、文字図形パターンがつぶれている場合、
白ビットから黒ビット又は黒ビットから白ビットに変化
する点が消滅し、本来検出されるべき位置で変化点が検
出できない。従って、抽出する特徴量が大幅に変わり、
誤認識の原因となっていた。
そこで、第3図(a)、(b)に示すゴシック体活字パ
ターン例のような、ある程度のパターンの変形を許容し
、認識精度を向上させるために、認識辞書の複数化を従
来行なっていた。しかしながら、この認識辞書の複数化
は、装置の大型化を招くと共に、照合に要する処理時間
を増大させるという欠点があった。
本発明は、以上述べた文字図形パターンのつぶれによっ
て、文字図形パターンからの特徴量の抽出が不安定にな
ることを防止し、認識辞書を複雑化することなく、文字
図形パターンのつぶれなどの変形を許容して認識精度を
向上させた、高速かつ認識精度の高い文字認識装置を提
供することを目的とする。
(問題点を解決するための手段) 本発明の文字認識装置は、認識すべき文字図形パターン
な光電変換して量子化し、黒ビット及び白ビットで表わ
されるディジタル信号の原パターンを得る光電変換部と
、更に、前記文字図形に外接する文字枠を設定する文字
枠検出部と、前記文字枠内において、前記原パターンの
複数の方向に第1の走査を行なって、前記原パターンか
ら特定の方向の文字図形成分のみを抽出した複数のサブ
パターンを作成するサブパターン抽出部と、前記各サブ
パターンについて前記特定の方向と異なる方向に第2の
走査を行ない、その走査中で前記黒ビットの連続個数に
相当する黒ランを検出する黒ラン検出部と、前記黒ラン
と線幅とを比較して特徴量の増分を求める特徴量増分計
算部と、前記各サブパターンの前記文字枠に囲まれた部
分をM×N個(M、Nは整数)の領域に分割し、各分割
領域に対応させたM行N列のデータから成る線長マトリ
クスを設定し、白ビットと黒ビットの変化点を基準に、
前記分割領域内のサブパターンの線長に応じた特徴量を
求めて、前記線長マトリクスの各分割領域に対応するデ
ータを決定する際に、前記黒ランを検出した分割領域に
ついて、前記特徴量の増分を分配して前記線長マトリク
スを得る線長マトリクス演算部と、こうして得られた前
記各サブパターンに対応する線長マトリクスに、正規化
のための所定の補正演算を行なって特徴マトリクスを得
る特徴マトリクス作成部と、その特徴マトリクスと、標
準文字図形パターンについて用意された標準マトリクス
とを比較して、前記原パターンに対応する文字図形を識
別する識別部とから成ることを特徴とするものである。
(作用) 以上の装置は、第2の走査を行なったとき、黒ビットの
連続する黒ランの値が、線幅と路間−の場合、従来装置
と同様に動作する。
一方、文字パターンがつぶれて、黒ランの値が線幅の何
倍かになると、その黒ランが何本分の線に相当するかを
示す特徴量の増分を求める。そして、本来の線が存在す
べき分割領域にその特徴量の増分を分配する。これによ
り、原パターンにつぶれがあっても無くても、路間−の
線長マトリクスが得られる。
(実施例) 以下、本発明の文字認識装置の一実施例を図面を参照し
て詳細に説明する。
〈文字認識装置の概要〉 第1図は、本発明の文字認識装置の実施例を示すブロッ
ク図である。
この装置は、読取部1と、光電変換部2と、パターンレ
ジスタ3と、線幅計算部4と、文字枠検出部5と、垂直
サブパターン抽出部6と、水平サブパターン抽出部7と
、右斜めサブパターン抽出部8と、左斜めサブパターン
抽出部9と、特徴マトリクス抽出部10と、識別部11
と、文字名出力端子12とから構成されている。尚、上
記4つのサブパターン抽出部6〜9をまとめてサブパタ
ーン抽出部20と呼ぶことにする。
また、特徴マトリクス抽出部10は、サブパターン切換
部101、黒ラン検出部102、特微量増分計算部10
3、分割点決定部104、線長マトリクス演算部105
及び特徴マトリクス作成部106から構成される装 置 ここで、光電変換部2はイメージラインセンサ等から成
り、光学系等から成る読取部1から入力する原パターン
の光信号を2値の量子化されたディジタル電気信号に変
換する回路である。パターンレジスタ3は、ランダム・
アクセス・メモ、り等から成り、この電気信号を例えば
1文字分格納する回路である。この格納の際、文字は例
えば100X 100個の画素に分解されて、各画素を
白ビット又は黒ビットで表わすディジタル信号がパ1 ターンレジスタ3に記憶される。
線幅計算部4は周知のディジタルフィルタ回路と同様の
シフトレジスタ構成となっている。この回路は、例えば
下記に示すような既知の近似式を用いて原パターン中の
文字図形の線幅Wを計算する。
w= 1/ {1−  (Q/A))       ・
・・(1)上式において、Qは、原パターンを2×2ビ
ツトのウィントウからのぞいた場合、その全ての点が黒
ビットとなる場合の数である。又、Aは、全黒ビットの
個数である。即ち、パターンレジスタ中のデータを受入
れて、これらQ及びAを計算し、その結果から上式を演
算する。こうして、読取データから原パターンを構成す
る文字の線幅Wが演算により求められる。
文字枠検出部5は、パターンレジスタ3内の原パターン
の文字図形に外接する文字枠を検出しする回路である。
具体的には、その文字枠を特定するための、例えば文字
枠の4隅あるいは相対する2隅のX,Y座標にあたるデ
ータを、特徴マトリ2 クス抽出部10へ送る回路である。
又、サブパターン抽出部20の中で、垂直サブパターン
抽出部6は、パターンレジスタ3に格納された原パター
ンについて、垂直スキャンを全面に行なって、各走査列
毎に黒ラン(黒ビットの連続個数)を検出し、その長さ
と線幅計算部4に於で計算された線幅との関係より、垂
直サブパターン(vsp)を抽出する回路である。同様
に、水平サブパターン抽出部7は、水平スキャンにより
水平サブパターン(HSP)を、右斜めサブパターン抽
出部8は、右斜め(45゜)スキャンにより、右斜めサ
ブパターン(RSP)を、左斜めサブパターン抽出部9
は、左斜め(45゜)スキャンにより、左斜めサブパタ
ーン(LSP)を抽出する回路である。各サブパターン
は、何れも、第2図(b)に示した通りの内容のもので
ある。これらのサブパターン抽出部6〜9は、パターン
レジスタと同様に、ランダム・アクセス・メモリ等から
構成される。
特徴マトリクス抽出部10は、各サブパターン 3  4 の文字枠検出部5て検出した文字枠に囲まれた領域を、
(NxM)の領域(例えばN=M=5)に分割し、最終
的に特徴マトリクスを得る回路である。例えば文字が1
00X 100の画素から構成され、N=M=5の場合
には、各分割領域は20X 20の画素を有することに
なる。この特徴マトリクスを得るために線長マトリクス
を求めるが、線長マトリクスと特徴マトリクスの構成は
、いずれも第2図(c)、(d)に示したものとほぼ同
様の形式となる。
ここで、特徴マトリクス抽出部10のサブパターン切換
部101は、垂直サブパターン抽出部6、水平サブパタ
ーン抽出部7、右斜めサブパターン抽出部8、左斜めサ
ブパターン抽出部9で得られたサブパターンを受入れて
、これらを切換えて選択的に出力するマルチプレクサ等
からなる回路である。選択されたサブパターンは、黒ラ
ン検出部102と線長マトリクス演算部105に出力さ
れる。
黒ラン検出部】02は、サブパターン切換部101から
受取ったサブパターンを各サブパターン毎に定められた
方向に走査しく第2の走査)、黒ランの長さ等を求める
回路である。この回路は、黒ランの開始点と終了点、即
ち、白ビットと黒ビットの変化点の位置座標を、線長マ
トリクス演算部105に出力し、かつ、黒ランの長さを
、特徴量増分計算部103に出力する回路である。
尚、第2の走査方向は、■SPについては先に説明した
ように、主走査方向を水平に左から右へ、副走査方向を
垂直に上から下へ走査する。また、H3Pについては主
走査方向を垂直に上から下へ、副走査方向を水平に左か
ら右へ走査する。
H3P、LSPは主走査方向を垂直に上から下へ、副走
査方向を水平に左から右へ、又は、主走査方向を水平に
左から右へ、副走査方向を垂直に上から下へ走査する。
特徴量増分計算部103は、黒ラン検出部102から受
取った黒ランの長さと、線幅計算部4で求めた線幅Wを
用いて、後述する特徴量の増分Kを算出し、線長マトリ
クス演算部105に出力する回路 5 である。
分割点決定部104は、文字枠検出部5から受取った文
字枠をもとに、文字枠をX軸とY軸の方向にNXMに等
分割する分割点を求め、線長マトリクス演算部】05に
、分割点の位置座標を出力する回路である(本実施例で
は、N二M=5である)。
線長マトリクス演算部105は、特徴量増分計算部10
3から受取った特徴量の増分にと、黒ラン検出部102
から受取った変化点の位置座標とから、第2図(C)で
説明したようなM行N列のデータから成る線長マトリク
スを演算する回路である。
特徴マトリクス作成部106は、第2図(d)で説明し
た正規化を行なって、特徴マトリクスを識別部11に出
力する回路である。
識別部11は、図示しないメモリに予め格納した標準文
字マスク(gl)と、特徴マトリクス抽出部10に於て
抽出された特徴マトリクス(fl)を比較する回路であ
る。この回路は、例えばこの種の文字認識手法として従
来から多用 6 されているように、(g+)と(fl)の距離(D)を
求める。その手法は次式(2)に示す通りである。
D=  (Σ(g+−f+) 2)””       
 ・・・(2)そして、その距離(D)が最少の値を与
える標準文字マスクのカテゴリ名を文字名として文字名
出力端子12から出力する。
〈特徴マトリクス抽出部の動作〉 ここで、第2図に示した垂直サブパターン(vsp)を
例にとり、特徴マトリクスを抽出する方法をより具体的
に説明する。
第4図は、その垂直サブパターンの特徴マトリクス抽出
法の説明図である。
先ず、垂直サブパターンの文字枠16に囲まれた部分を
、M×N個の領域に分割する。次に、線長マトリクス演
算部105(第1図)は、第4図に示すように、各分割
領域15毎に設けた図示していない合計(NXM)個の
線長マトリクス用メモリの記憶する数値を” o ”に
クリアする。その一方で、黒ラン検出部102は、文字
枠16内な水 8 平に左から右(主走査方向17)へ走査し、その走査列
単位に、白ビット(文字背景部19)から黒ビット(文
字線部18)へ変化した時の黒ビットP8の座標位置(
xw、、yo)と、黒ビットから白ビットへ変化した時
の黒ビットPbの座標位置(XBw、 Y、 )を変化
点として検出する。
一方、特徴量増分計算部103は、次の要領で特徴量の
増分Kを求める。
この特徴量の増分には、白ビットから黒ビットに変化し
た時の黒ビットから、黒ビットから白ビットへ変化した
時の黒ビットまでの黒ビットの連続個数を黒シンと定義
したとき、その黒ランと、先に線幅計算部4が(1)式
を用いて計算した線幅Wを用いて、次式(3)のように
算出する。但し、Kは整数であり、右辺の計算結果の小
数点以下を切り捨てて求める。
K=(ax (Xaw−Xwe+1)/W)+b   
    ・(3)ここで、a、bは何れも定数で、本実
施例ではa=0.6.b=1と定めた。
第2図で説明した従来技術では、このKを単に” 1 
”とおいている。
一方、本発明では、先ず黒ランを求める。この黒ランは
上式(Xaw4wa”l)に相当する値である。
そして、黒ランと線幅Wとの比を求め、定数aとの積を
とり、定数すを加算している。
この結果、黒ランが文字のつぶれ等により大きな値にな
ると、Kもそれにほぼ比例して大きくなる。即ち、特徴
量の増分には、この黒ランが、幅Wの線が何本集まって
できたものか示す値となる。
理論的には、(Xaw−XwB+1)とWの比からKを
直接求めればよいが、文字図形を構成する線の輪郭の性
質等を考慮して、実験的に最適な換算式を求めた結果、
上記a、bを得た。
線長マトリクス演算部105は、特徴量増分計算部10
3から受取った特徴量の増分にと、黒ラン検出部102
から受取った上記変化点の位置座標から、変化点間を特
徴量の増分にで等分割し、それぞれの中点の位置座標を
求める。更に、各中点の位置座標を、分割点決定部10
4から受取った分割 9 点の位置座標と比較し、第4図に示した各M×N個の各
分割領域15に含まれる中点の数を計数し、M行N列の
線長マトリクスを抽出する。その具体的な動作は、後で
〈装置の具体的な動作〉の項目で述べる。
こうして、第2図(C)に示した線長マトリクスが得ら
れる。
次に、特徴マトリクス作成部106は、抽出した線長マ
トリクスを標準的な文字の大きさに正規化し、特徴マト
リクスを作成する。
その方法は、正規化前の線長マトリクスの1要素なei
j 、正規化後の特徴マトリクスの1要素をLij 、
文字枠の水平方向の長さ(画素数)を△X、垂直方向の
長さ(画素数)をΔYとすると、下式 (4)〜(6)
−のような処理を行なう。
(A)垂直サブパターン(vsp)マトリクスの場合、 Lij =eij /△Y・・・(4)(B)水平サブ
パターン(H3P)マトリクスの場合、  0 Lij =eij /△X          ・・・
(5)(C)斜めサブパターン(H3P、LSP)マト
リクスの場合、 Lij =eij/((ΔX)2+(△y ) 2) 
1/2   、、、 (5)以上の処理により、特徴マ
トリクス抽出部10は、最終的に、原パターンを表現す
る第2図(d)に示すような ((Nx M) x 4
)次元の正規化した特徴マトリクスを作成して、識別部
11(第1図)に向けて出力する。識別部11の動作は
先に説明した通りである。
〈装置の具体的な動作〉 以下、第3図と第5図とを用いて、本発明の装置の具体
的な文字認識動作について説明する。
第5図(a)には、第3図(a)に示したつぶれていな
い文字パターンから抽出した垂直サブパターンの一部を
図示し、第5図(b)には、第3図(b)に示したつぶ
れた文字パターンから抽出した垂直サブパターンの一部
を図示した。
第5図(a)、(b)の各1×5個の分割領域15は、
それぞれ第3図(a)、(b)中に示し1 2 たラインX。、 X 5+ Y 3. Y 4に囲まれ
た領域である。
第5図中の黒丸31は、走査列30中で白ビットから黒
ビットに変化した変化点の黒ビット、黒丸32は黒ビッ
トから白ビットに変化した変化点の黒ビット、白丸33
はこれらの2つの黒ビットの中点である。
先ず、比較例として、第5図(a)に示したような垂直
サブパターンを図のように水平方向に走査し、前述 (
3)式を用いて特徴量の増分Kを求める。
ここで、黒ランの値は例えばそれぞれ4°”とする。
また、この原パターンについて、線幅計算部4(第1図
)で求められた線幅Wは3.3とする。その場合、 (
3)式から(0,6X 4/3.3)+1を計算してそ
の整数部を求めると、特徴量の増分に=1となる。
故に、1回の走査毎に、サブパターンの中点33が存在
する各分割領域に対応するメモリに” 1 ”を加算す
る。即ち、Xl、X2.Y3.Y4 テ囲まれた分割領
域、X2.X3.Y3.Y4で囲まれた分割領域、 X
 3. X 4. Y 3. Y 4で囲まれた分割領
域に対応する各メモリに°゛1°°を加算する。
一方、第5図(b)に示したつぶれの生じた垂直サブパ
ターンを図のように水平方向に走査すると、当該走査列
30中の黒ランの値は’ 27 ”となる。また、この
原パターンの線幅計算部で求められた線幅はつぶれの影
響により (1)式からW = 7.6となる。
故に前述の (3)式で特徴量の増分Kを求めると、(
0,6x 27/1.6)+1を計算してに=3を得る
即ち、変化点の黒ビット31と黒ビット32のX座標を
それぞれ、Xdo、 Xa3とすると、X、。からXd
3の間を3分割する点は、それぞれ分割点34、分割点
35であり、それぞれのX座標はXdl、 Xd2であ
る。
ここで、黒ビット31と分割点34の中点33、が存在
する分割領域、即ちX + 、 X 2 、 Y 3¥
4で囲まれた分割領域に対応するメモリに3 1”°を加算する。また、分割点34と分割点35の中
点33bが存在する領域、即ちX 2 、 X 3Y 
3. Y 4で囲まれた分割領域に対応するメモリに1
″゛を加算する。更に、分割点35と黒ビットの終点3
2の中点33cが存在する領域、即ちX 3X 4. 
Y 3. Y 4で囲まれた分割領域に対応するメモリ
にl′°を加算する。
以上より、1回の水平方向の走査による3つの中点33
.〜33cの存在する各分割領域のメモリの増分がそれ
ぞれ” 1 ”となるように分配された。
即ち、第5図(b)のつぶれた垂直サブパターンについ
ては、当該走査方向の黒ランの値に比例して複数の中点
を求め、黒ランを検出した複数の分割領域のメモリの増
分を決定している。その結果、第5図(a)のつぶれて
いない垂直サブパターンを走査した場合と同一の内容の
線長マトリクスを得ることができる。他のサブパターン
についても全く同様のことがいえる。
尚、上記実施例では、 (3)式で求めた特徴量の 4 増分Kから、複数の中点を求めて分割領域に対応するメ
モリのデータを決定している。
しかし、黒ランを検出した各分割領域に対して、上記特
徴量の増分Kを適当に均一に分配すれば、同様の線長マ
トリクスが得られる。又、特徴量として必ずしも中点を
求める必要はなく、順に並んだ変化点と分割点の中間に
位置する一定の点を求めれば差し支えない。
(発明の効果) 以上詳細に説明したように、本発明の文字認識装置によ
れば、抽出する特徴量を、黒シンと当該原パターンの線
幅とを比較して、その結果に応じた増分を考慮して決定
するので、文字図形パターンにつぶれがある場合でも抽
出する特徴量が変動せず安定となり、高い認識精度を得
ることができる。
【図面の簡単な説明】
第1図は本発明の文字認識装置の実施例を示すブロック
図、第2図は従来の文字図形パターンの特徴抽出方法を
示す説明図、第3図はゴシック体 R 6 活字パターンのつぶれの例を示す平面図、第4図は垂直
サブパターンの特徴マトリクス抽出方向の説明図、第5
図は本発明の装置の具体的な動作説明図である。 1・・・読取部、2・・・光電変換部、3・・・パター
ンレジスタ、 4・・・線幅計算部、 5・・・文字枠検出部、 6・・・垂直サブパターン抽出部、 7・・・水平サブパターン抽出部、 8・・・右斜めサブパターン抽出部、 9・・・左斜めサブパターン抽出部、 10・・・特徴マトリクス抽出部、11・・・識別部、
12・・・文字名出力端子、 20・・・サブパターン抽出部、 旧・・・サブパターン切換部、 02・・・黒ラン検出部、 03・・・特徴量増分計算部、 04・・・分割点決定部、 05・・・線長マトリクス演算部、 ・・・特徴マト リクス作成部。  7 サブパターン (b) 線長マトリクス (c) 従来の文字図形パターンの特徴抽出法 第  2  図 垂直サブパターンの特徴マトリクス抽出法第・1図 (a) つぶれていないパターンの例 0 1 2 3 4 5 (b) つぶれたパターンの例 本発明の装置の作用の説明図 第  5  図

Claims (1)

  1. 【特許請求の範囲】 認識すべき文字図形パターンを光電変換して量子化し、
    黒ビット及び白ビットで表わされるディジタル信号の原
    パターンを得る光電変換部と、更に、前記文字図形に外
    接する文字枠を設定する文字枠検出部と、 前記文字枠内において、前記原パターンの複数の方向に
    第1の走査を行なって、前記原パターンから特定の方向
    の文字図形成分のみを抽出した複数のサブパターンを作
    成するサブパターン抽出部と、 前記各サブパターンについて前記特定の方向と異なる方
    向に第2の走査を行ない、 その走査中で前記黒ビットの連続個数に相当する黒ラン
    を検出する黒ラン検出部と、 前記黒ランと線幅とを比較して特徴量の増分を求める特
    徴量増分計算部と、 前記各サブパターンの前記文字枠に囲まれた部分をM×
    N個(M、Nは整数)の領域に分割し、各分割領域に対
    応させたM行N列のデータから成る線長マトリクスを設
    定し、白ビットと黒ビットの変化点を基準に、前記分割
    領域内のサブパターンの線長に応じた特徴量を求めて、
    前記線長マトリクスの各分割領域に対応するデータを決
    定する際に、前記黒ランを検出した分割領域について、
    前記特徴量の増分を分配して前記線長マトリクスを得る
    線長マトリクス演算部と、 こうして得られた前記各サブパターンに対応する線長マ
    トリクスに、正規化のための所定の補正演算を行なって
    特徴マトリクスを得る特徴マトリクス作成部と、 その特徴マトリクスと、標準文字図形パターンについて
    用意された標準マトリクスとを比較して、前記原パター
    ンに対応する文字図形を識別する識別部とから成ること
    を特徴とする文字認識装置。
JP1144201A 1989-06-08 1989-06-08 文字認識装置 Pending JPH0310389A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1144201A JPH0310389A (ja) 1989-06-08 1989-06-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1144201A JPH0310389A (ja) 1989-06-08 1989-06-08 文字認識装置

Publications (1)

Publication Number Publication Date
JPH0310389A true JPH0310389A (ja) 1991-01-17

Family

ID=15356572

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1144201A Pending JPH0310389A (ja) 1989-06-08 1989-06-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPH0310389A (ja)

Similar Documents

Publication Publication Date Title
JP3338537B2 (ja) 画像傾き検出装置
US4556985A (en) Pattern recognition apparatus
US20100239166A1 (en) Character recognition device, image-reading device, computer readable medium, and character recognition method
WO1991020055A1 (en) Self-centering character stroke thickening for optical character recognition
JPH0310389A (ja) 文字認識装置
JPH01152586A (ja) 文字図形認識方法
JPH01152585A (ja) 特徴抽出方法
JPH01152587A (ja) 文字図形認識方法
JP2749946B2 (ja) 文字認識方法
JP2980636B2 (ja) 文字認識装置
JPH03126188A (ja) 文字認識装置
JP3104355B2 (ja) 特徴抽出装置
JPH0656625B2 (ja) 特徴抽出方式
JP2616994B2 (ja) 特徴抽出装置
JP2749947B2 (ja) 文字認識方法
JPS6019287A (ja) 文字認識方法
JPH02166583A (ja) 文字認識装置
JPS5837780A (ja) 文字認識方式
JPH10143607A (ja) 画像処理装置
JPH05250518A (ja) 文字認識方法
JPS62154079A (ja) 文字認識方式
JPH01187684A (ja) 文字認識装置
JPH11154200A (ja) 文字認識装置
JPH0656624B2 (ja) 特徴抽出方式
JPH10222609A (ja) 文字色判定装置