JPH0310389A

JPH0310389A - 文字認識装置

Info

Publication number: JPH0310389A
Application number: JP1144201A
Authority: JP
Inventors: Hirohisa Goto; 後藤　裕久; Koichi Higuchi; 浩一樋口; Yoshiyuki Yamashita; 山下　義征
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1989-06-08
Filing date: 1989-06-08
Publication date: 1991-01-17

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】（産業上の利用分野）本発明は、文字図形を光学的に読取って認識する文字認
識装置に関する。

（従来の技術）従来、例えば文字図形認識装置に於ては、紙面等から読
取られた文字図形パターンよりその文字等を構成するス
トロークを抽出し、それら抽出されたストロークの位置
、長さ、ストローク間の相互関係等を用いて文字等を認
識する方法が多く採用されていた。

例えばその第１の手法においては、文字図形パターンの
輪郭を追跡することにより検出された輪郭点系列（座標
値の集合）についてその曲率を計算し、曲率の大きな値
の点を分割点として輪郭点系列を分割し、分割された系
列を組合わせることによりストロークを抽出し、そのス
トロークについて幾何学的な特徴等を抽出して標準文字
マスクと照合し、文字図形を認識するようにしていた。

又、第２の手法においては、文字図形パターンの細線化
処理を行なって骨格化し、その骨格パターンの連結性及
び骨格パターンを追跡し、急激な角度の変化点等を検出
してストロークを抽出し、そのストロークについて第１
の手法と同様に幾何学的な特徴等を抽出して文字図形の
認識を行なっていた。

しかしながら上記第１の手法は、文字図形パターンのデ
ータ量が大きくなり、又文字図形パターンが複雑化する
と、その処理量が増大し処理速度の低下を招く欠点があ
った。

又、第２の手法は、文字図形パターンを細線化する必要
があり、その細線化によるパターンのひずみ、屈曲点等
における不要なヒゲの発生等の問題があり、その後の処
理を複雑なものとしていた。

このような問題を解決するために、本出願人は、先の出
願（特開昭６２−１５４０７９号公報）により、以下の
（ａ）から（ｆ）の手順に従って文字図形パターンの特
徴抽出を行なう方法を提案している。

第２図（ａ）〜（ｅ）にその構成を図解した。

（Ａ）先ず、紙面等に記載された文字図形パターンをイ
メージラインセンサ等で読取り、光電変換して量子化す
ることにより、黒ビット及び白ビットで表わされるディ
ジタル信号の原パターン２１を作成する［第２図（ａ）
］。

（Ｂ）次に、その原パターン中の文字図形の線幅Ｗを算
出する。

（Ｃ）次に、文字に外接する文字枠２２により文字を取
り囲む。そして、その文字枠内領域において、原パター
ン２１について複数の方向（例えば縦、横、斜め方向）
に第１の走査（それぞれ全面走査）を行なって、各方向
の走査について各走査列毎の黒ビットの連続個数を検出
する。次に、当該黒ビットの連続個数と前記線幅Ｗとに
基づいて、第１の走査の、上記走査方向毎に、対応した
複数のサブパターン（ＶＳＰ、Ｈ３Ｐ、Ｈ３Ｐ。

ＬＳＰ）を抽出する。

具体的には、第２図（ａ）の原パターンから、縦方向の
ストローク、横方向のストローク、斜め方向のストロー
クのみをそれぞれ抽出して、これらをもとに、サブパタ
ーン２３ａ〜２３ｄを得ることを意味する［第２図（ｂ
）］。

（Ｄ）次に、上記原パターン２１の文字枠内領域を上記
各サブパターン毎に（ＮｘＭ）個の領域（Ｎ、Ｍは整数
、図の例ではＭ＝Ｎ＝５）に分割し、更に各サブパター
ンの抽出の際に走査した第１の走査の方向と所定の角度
（例えば９０°）を成す方向にそれぞれ第２の走査を行
ない、白ビットから黒ビット、黒ビットから白ビットへ
変化したときの黒ビットの座標位置を基に線長マトリク
スを作成する。

具体的には、第２図（ｂ）の垂直サブパターン（ｖｓｐ
）中に例示したように、第２の走査２７を行なったとき
、線２８との交叉部分の中点２９を求める。そして、そ
の中点２９が存在する線長マトリクス上のデータに°１
″′を加算する。例えば１００Ｘ　１００画素構成の各
サブパターンの全画素について第２の走査を行なえば、
各分割領域でそれぞれ２０個の中点が検出されるから、
その分割領域を一端から他端まで通過する線についての
特微量は、それぞれ“’２０”となる。分割領域内で終
端する線についての特徴量は、その領域内における線長
に応じた値となる。その結果、例えば第２図（Ｃ）のよ
うな線長マトリクス２４ａ〜２４ｄを得る。

（Ｅ）次に、その線長マトリクスを文字の大きさで正規
化して特徴マトリクスを作成する。

具体的には、標準文字図形パターンについて用意された
標準マトリクスとこの線長マトリクスを比較する前に、
原パターン２１の縦横比やサイズを標準文字図形のそれ
に近づけるための補正演算を行なう。

（Ｆ）こうして得られた特徴マトリクス２５を、予め用
意した文字図形パターンの標準マトリクスと照合して文
字図形を認識する。

（発明が解決しようとする問題点）ところで、文字図形パターンを光電変換するイメージセ
ンサの分解能の不足や、文字図形パターンそのものの画
像のボケ等により、実質的に読み取られる文字図形パタ
ーンが、つぶれてしま、う現象がある。

第３図（ａ）はつぶれていない原パターンを示し、同図
（ｂ）はつぶれてしまった原パターンを示したものであ
る。

先に説明したような、各サブパターンを走査して得られ
る白ビットから黒ビット、又は黒ビットから白ビットに
変化するときの変化点を基にして線長マトリクスを作成
する方法では、文字図形パターンがつぶれている場合、
白ビットから黒ビット又は黒ビットから白ビットに変化
する点が消滅し、本来検出されるべき位置で変化点が検
出できない。従って、抽出する特徴量が大幅に変わり、
誤認識の原因となっていた。

そこで、第３図（ａ）、（ｂ）に示すゴシック体活字パ
ターン例のような、ある程度のパターンの変形を許容し
、認識精度を向上させるために、認識辞書の複数化を従
来行なっていた。しかしながら、この認識辞書の複数化
は、装置の大型化を招くと共に、照合に要する処理時間
を増大させるという欠点があった。

本発明は、以上述べた文字図形パターンのつぶれによっ
て、文字図形パターンからの特徴量の抽出が不安定にな
ることを防止し、認識辞書を複雑化することなく、文字
図形パターンのつぶれなどの変形を許容して認識精度を
向上させた、高速かつ認識精度の高い文字認識装置を提
供することを目的とする。

（問題点を解決するための手段）本発明の文字認識装置は、認識すべき文字図形パターン
な光電変換して量子化し、黒ビット及び白ビットで表わ
されるディジタル信号の原パターンを得る光電変換部と
、更に、前記文字図形に外接する文字枠を設定する文字
枠検出部と、前記文字枠内において、前記原パターンの
複数の方向に第１の走査を行なって、前記原パターンか
ら特定の方向の文字図形成分のみを抽出した複数のサブ
パターンを作成するサブパターン抽出部と、前記各サブ
パターンについて前記特定の方向と異なる方向に第２の
走査を行ない、その走査中で前記黒ビットの連続個数に
相当する黒ランを検出する黒ラン検出部と、前記黒ラン
と線幅とを比較して特徴量の増分を求める特徴量増分計
算部と、前記各サブパターンの前記文字枠に囲まれた部
分をＭ×Ｎ個（Ｍ、Ｎは整数）の領域に分割し、各分割
領域に対応させたＭ行Ｎ列のデータから成る線長マトリ
クスを設定し、白ビットと黒ビットの変化点を基準に、
前記分割領域内のサブパターンの線長に応じた特徴量を
求めて、前記線長マトリクスの各分割領域に対応するデ
ータを決定する際に、前記黒ランを検出した分割領域に
ついて、前記特徴量の増分を分配して前記線長マトリク
スを得る線長マトリクス演算部と、こうして得られた前
記各サブパターンに対応する線長マトリクスに、正規化
のための所定の補正演算を行なって特徴マトリクスを得
る特徴マトリクス作成部と、その特徴マトリクスと、標
準文字図形パターンについて用意された標準マトリクス
とを比較して、前記原パターンに対応する文字図形を識
別する識別部とから成ることを特徴とするものである。

（作用）以上の装置は、第２の走査を行なったとき、黒ビットの
連続する黒ランの値が、線幅と路間−の場合、従来装置
と同様に動作する。

一方、文字パターンがつぶれて、黒ランの値が線幅の何
倍かになると、その黒ランが何本分の線に相当するかを
示す特徴量の増分を求める。そして、本来の線が存在す
べき分割領域にその特徴量の増分を分配する。これによ
り、原パターンにつぶれがあっても無くても、路間−の
線長マトリクスが得られる。

（実施例）以下、本発明の文字認識装置の一実施例を図面を参照し
て詳細に説明する。

〈文字認識装置の概要〉第１図は、本発明の文字認識装置の実施例を示すブロッ
ク図である。

この装置は、読取部１と、光電変換部２と、パターンレ
ジスタ３と、線幅計算部４と、文字枠検出部５と、垂直
サブパターン抽出部６と、水平サブパターン抽出部７と
、右斜めサブパターン抽出部８と、左斜めサブパターン
抽出部９と、特徴マトリクス抽出部１０と、識別部１１
と、文字名出力端子１２とから構成されている。尚、上
記４つのサブパターン抽出部６〜９をまとめてサブパタ
ーン抽出部２０と呼ぶことにする。

また、特徴マトリクス抽出部１０は、サブパターン切換
部１０１、黒ラン検出部１０２、特微量増分計算部１０
３、分割点決定部１０４、線長マトリクス演算部１０５
及び特徴マトリクス作成部１０６から構成される装置ここで、光電変換部２はイメージラインセンサ等から成
り、光学系等から成る読取部１から入力する原パターン
の光信号を２値の量子化されたディジタル電気信号に変
換する回路である。パターンレジスタ３は、ランダム・
アクセス・メモ、り等から成り、この電気信号を例えば
１文字分格納する回路である。この格納の際、文字は例
えば１００Ｘ　１００個の画素に分解されて、各画素を
白ビット又は黒ビットで表わすディジタル信号がパ１ターンレジスタ３に記憶される。

線幅計算部４は周知のディジタルフィルタ回路と同様の
シフトレジスタ構成となっている。この回路は、例えば
下記に示すような既知の近似式を用いて原パターン中の
文字図形の線幅Ｗを計算する。

ｗ＝　１／　｛１−　　（Ｑ／Ａ））　　　　　　　・
・・（１）上式において、Ｑは、原パターンを２×２ビ
ツトのウィントウからのぞいた場合、その全ての点が黒
ビットとなる場合の数である。又、Ａは、全黒ビットの
個数である。即ち、パターンレジスタ中のデータを受入
れて、これらＱ及びＡを計算し、その結果から上式を演
算する。こうして、読取データから原パターンを構成す
る文字の線幅Ｗが演算により求められる。

文字枠検出部５は、パターンレジスタ３内の原パターン
の文字図形に外接する文字枠を検出しする回路である。

具体的には、その文字枠を特定するための、例えば文字
枠の４隅あるいは相対する２隅のＸ，Ｙ座標にあたるデ
ータを、特徴マトリ２クス抽出部１０へ送る回路である。

又、サブパターン抽出部２０の中で、垂直サブパターン
抽出部６は、パターンレジスタ３に格納された原パター
ンについて、垂直スキャンを全面に行なって、各走査列
毎に黒ラン（黒ビットの連続個数）を検出し、その長さ
と線幅計算部４に於で計算された線幅との関係より、垂
直サブパターン（ｖｓｐ）を抽出する回路である。同様
に、水平サブパターン抽出部７は、水平スキャンにより
水平サブパターン（ＨＳＰ）を、右斜めサブパターン抽
出部８は、右斜め（４５゜）スキャンにより、右斜めサ
ブパターン（ＲＳＰ）を、左斜めサブパターン抽出部９
は、左斜め（４５゜）スキャンにより、左斜めサブパタ
ーン（ＬＳＰ）を抽出する回路である。各サブパターン
は、何れも、第２図（ｂ）に示した通りの内容のもので
ある。これらのサブパターン抽出部６〜９は、パターン
レジスタと同様に、ランダム・アクセス・メモリ等から
構成される。

特徴マトリクス抽出部１０は、各サブパターン　３　４の文字枠検出部５て検出した文字枠に囲まれた領域を、
（ＮｘＭ）の領域（例えばＮ＝Ｍ＝５）に分割し、最終
的に特徴マトリクスを得る回路である。例えば文字が１
００Ｘ　１００の画素から構成され、Ｎ＝Ｍ＝５の場合
には、各分割領域は２０Ｘ　２０の画素を有することに
なる。この特徴マトリクスを得るために線長マトリクス
を求めるが、線長マトリクスと特徴マトリクスの構成は
、いずれも第２図（ｃ）、（ｄ）に示したものとほぼ同
様の形式となる。

ここで、特徴マトリクス抽出部１０のサブパターン切換
部１０１は、垂直サブパターン抽出部６、水平サブパタ
ーン抽出部７、右斜めサブパターン抽出部８、左斜めサ
ブパターン抽出部９で得られたサブパターンを受入れて
、これらを切換えて選択的に出力するマルチプレクサ等
からなる回路である。選択されたサブパターンは、黒ラ
ン検出部１０２と線長マトリクス演算部１０５に出力さ
れる。

黒ラン検出部】０２は、サブパターン切換部１０１から
受取ったサブパターンを各サブパターン毎に定められた
方向に走査しく第２の走査）、黒ランの長さ等を求める
回路である。この回路は、黒ランの開始点と終了点、即
ち、白ビットと黒ビットの変化点の位置座標を、線長マ
トリクス演算部１０５に出力し、かつ、黒ランの長さを
、特徴量増分計算部１０３に出力する回路である。

尚、第２の走査方向は、■ＳＰについては先に説明した
ように、主走査方向を水平に左から右へ、副走査方向を
垂直に上から下へ走査する。また、Ｈ３Ｐについては主
走査方向を垂直に上から下へ、副走査方向を水平に左か
ら右へ走査する。

Ｈ３Ｐ、ＬＳＰは主走査方向を垂直に上から下へ、副走
査方向を水平に左から右へ、又は、主走査方向を水平に
左から右へ、副走査方向を垂直に上から下へ走査する。

特徴量増分計算部１０３は、黒ラン検出部１０２から受
取った黒ランの長さと、線幅計算部４で求めた線幅Ｗを
用いて、後述する特徴量の増分Ｋを算出し、線長マトリ
クス演算部１０５に出力する回路　５である。

分割点決定部１０４は、文字枠検出部５から受取った文
字枠をもとに、文字枠をＸ軸とＹ軸の方向にＮＸＭに等
分割する分割点を求め、線長マトリクス演算部】０５に
、分割点の位置座標を出力する回路である（本実施例で
は、Ｎ二Ｍ＝５である）。

線長マトリクス演算部１０５は、特徴量増分計算部１０
３から受取った特徴量の増分にと、黒ラン検出部１０２
から受取った変化点の位置座標とから、第２図（Ｃ）で
説明したようなＭ行Ｎ列のデータから成る線長マトリク
スを演算する回路である。

特徴マトリクス作成部１０６は、第２図（ｄ）で説明し
た正規化を行なって、特徴マトリクスを識別部１１に出
力する回路である。

識別部１１は、図示しないメモリに予め格納した標準文
字マスク（ｇｌ）と、特徴マトリクス抽出部１０に於て
抽出された特徴マトリクス（ｆｌ）を比較する回路であ
る。この回路は、例えばこの種の文字認識手法として従
来から多用　６されているように、（ｇ＋）と（ｆｌ）の距離（Ｄ）を
求める。その手法は次式（２）に示す通りである。

Ｄ＝　　（Σ（ｇ＋−ｆ＋）　２）””　　　　　　　
　・・・（２）そして、その距離（Ｄ）が最少の値を与
える標準文字マスクのカテゴリ名を文字名として文字名
出力端子１２から出力する。

〈特徴マトリクス抽出部の動作〉ここで、第２図に示した垂直サブパターン（ｖｓｐ）を
例にとり、特徴マトリクスを抽出する方法をより具体的
に説明する。

第４図は、その垂直サブパターンの特徴マトリクス抽出
法の説明図である。

先ず、垂直サブパターンの文字枠１６に囲まれた部分を
、Ｍ×Ｎ個の領域に分割する。次に、線長マトリクス演
算部１０５（第１図）は、第４図に示すように、各分割
領域１５毎に設けた図示していない合計（ＮＸＭ）個の
線長マトリクス用メモリの記憶する数値を”　ｏ　”に
クリアする。その一方で、黒ラン検出部１０２は、文字
枠１６内な水　８平に左から右（主走査方向１７）へ走査し、その走査列
単位に、白ビット（文字背景部１９）から黒ビット（文
字線部１８）へ変化した時の黒ビットＰ８の座標位置（
ｘｗ、、ｙｏ）と、黒ビットから白ビットへ変化した時
の黒ビットＰｂの座標位置（ＸＢｗ、　Ｙ、　）を変化
点として検出する。

一方、特徴量増分計算部１０３は、次の要領で特徴量の
増分Ｋを求める。

この特徴量の増分には、白ビットから黒ビットに変化し
た時の黒ビットから、黒ビットから白ビットへ変化した
時の黒ビットまでの黒ビットの連続個数を黒シンと定義
したとき、その黒ランと、先に線幅計算部４が（１）式
を用いて計算した線幅Ｗを用いて、次式（３）のように
算出する。但し、Ｋは整数であり、右辺の計算結果の小
数点以下を切り捨てて求める。

Ｋ＝（ａｘ　（Ｘａｗ−Ｘｗｅ＋１）／Ｗ）＋ｂ　　　
　　　　・（３）ここで、ａ、ｂは何れも定数で、本実
施例ではａ＝０．６．ｂ＝１と定めた。

第２図で説明した従来技術では、このＫを単に”　１　
”とおいている。

一方、本発明では、先ず黒ランを求める。この黒ランは
上式（Ｘａｗ４ｗａ”ｌ）に相当する値である。

そして、黒ランと線幅Ｗとの比を求め、定数ａとの積を
とり、定数すを加算している。

この結果、黒ランが文字のつぶれ等により大きな値にな
ると、Ｋもそれにほぼ比例して大きくなる。即ち、特徴
量の増分には、この黒ランが、幅Ｗの線が何本集まって
できたものか示す値となる。

理論的には、（Ｘａｗ−ＸｗＢ＋１）とＷの比からＫを
直接求めればよいが、文字図形を構成する線の輪郭の性
質等を考慮して、実験的に最適な換算式を求めた結果、
上記ａ、ｂを得た。

線長マトリクス演算部１０５は、特徴量増分計算部１０
３から受取った特徴量の増分にと、黒ラン検出部１０２
から受取った上記変化点の位置座標から、変化点間を特
徴量の増分にで等分割し、それぞれの中点の位置座標を
求める。更に、各中点の位置座標を、分割点決定部１０
４から受取った分割　９点の位置座標と比較し、第４図に示した各Ｍ×Ｎ個の各
分割領域１５に含まれる中点の数を計数し、Ｍ行Ｎ列の
線長マトリクスを抽出する。その具体的な動作は、後で
〈装置の具体的な動作〉の項目で述べる。

こうして、第２図（Ｃ）に示した線長マトリクスが得ら
れる。

次に、特徴マトリクス作成部１０６は、抽出した線長マ
トリクスを標準的な文字の大きさに正規化し、特徴マト
リクスを作成する。

その方法は、正規化前の線長マトリクスの１要素なｅｉ
ｊ　、正規化後の特徴マトリクスの１要素をＬｉｊ　、
文字枠の水平方向の長さ（画素数）を△Ｘ、垂直方向の
長さ（画素数）をΔＹとすると、下式　（４）〜（６）
−のような処理を行なう。

（Ａ）垂直サブパターン（ｖｓｐ）マトリクスの場合、Ｌｉｊ　＝ｅｉｊ　／△Ｙ・・・（４）（Ｂ）水平サブ
パターン（Ｈ３Ｐ）マトリクスの場合、　０Ｌｉｊ　＝ｅｉｊ　／△Ｘ　　　　　　　　　　・・・
（５）（Ｃ）斜めサブパターン（Ｈ３Ｐ、ＬＳＰ）マト
リクスの場合、Ｌｉｊ　＝ｅｉｊ／（（ΔＸ）２＋（△ｙ　）　２）　
１／２　　　、、、　（５）以上の処理により、特徴マ
トリクス抽出部１０は、最終的に、原パターンを表現す
る第２図（ｄ）に示すような　（（Ｎｘ　Ｍ）　ｘ　４
）次元の正規化した特徴マトリクスを作成して、識別部
１１（第１図）に向けて出力する。識別部１１の動作は
先に説明した通りである。

〈装置の具体的な動作〉以下、第３図と第５図とを用いて、本発明の装置の具体
的な文字認識動作について説明する。

第５図（ａ）には、第３図（ａ）に示したつぶれていな
い文字パターンから抽出した垂直サブパターンの一部を
図示し、第５図（ｂ）には、第３図（ｂ）に示したつぶ
れた文字パターンから抽出した垂直サブパターンの一部
を図示した。

第５図（ａ）、（ｂ）の各１×５個の分割領域１５は、
それぞれ第３図（ａ）、（ｂ）中に示し１２たラインＸ。、　Ｘ　５＋　Ｙ　３．　Ｙ　４に囲まれ
た領域である。

第５図中の黒丸３１は、走査列３０中で白ビットから黒
ビットに変化した変化点の黒ビット、黒丸３２は黒ビッ
トから白ビットに変化した変化点の黒ビット、白丸３３
はこれらの２つの黒ビットの中点である。

先ず、比較例として、第５図（ａ）に示したような垂直
サブパターンを図のように水平方向に走査し、前述　（
３）式を用いて特徴量の増分Ｋを求める。

ここで、黒ランの値は例えばそれぞれ４°”とする。

また、この原パターンについて、線幅計算部４（第１図
）で求められた線幅Ｗは３．３とする。その場合、　（
３）式から（０，６Ｘ　４／３．３）＋１を計算してそ
の整数部を求めると、特徴量の増分に＝１となる。

故に、１回の走査毎に、サブパターンの中点３３が存在
する各分割領域に対応するメモリに”　１　”を加算す
る。即ち、Ｘｌ、Ｘ２．Ｙ３．Ｙ４　テ囲まれた分割領
域、Ｘ２．Ｘ３．Ｙ３．Ｙ４で囲まれた分割領域、　Ｘ
　３．　Ｘ　４．　Ｙ　３．　Ｙ　４で囲まれた分割領
域に対応する各メモリに°゛１°°を加算する。

一方、第５図（ｂ）に示したつぶれの生じた垂直サブパ
ターンを図のように水平方向に走査すると、当該走査列
３０中の黒ランの値は’　２７　”となる。また、この
原パターンの線幅計算部で求められた線幅はつぶれの影
響により　（１）式からＷ　＝　７．６となる。

故に前述の　（３）式で特徴量の増分Ｋを求めると、（
０，６ｘ　２７／１．６）＋１を計算してに＝３を得る
。

即ち、変化点の黒ビット３１と黒ビット３２のＸ座標を
それぞれ、Ｘｄｏ、　Ｘａ３とすると、Ｘ、。からＸｄ
３の間を３分割する点は、それぞれ分割点３４、分割点
３５であり、それぞれのＸ座標はＸｄｌ、　Ｘｄ２であ
る。

ここで、黒ビット３１と分割点３４の中点３３、が存在
する分割領域、即ちＸ　＋　、　Ｘ　２　、　Ｙ　３￥
４で囲まれた分割領域に対応するメモリに３１”°を加算する。また、分割点３４と分割点３５の中
点３３ｂが存在する領域、即ちＸ　２　、　Ｘ　３Ｙ　
３．　Ｙ　４で囲まれた分割領域に対応するメモリに１
″゛を加算する。更に、分割点３５と黒ビットの終点３
２の中点３３ｃが存在する領域、即ちＸ　３Ｘ　４．　
Ｙ　３．　Ｙ　４で囲まれた分割領域に対応するメモリ
にｌ′°を加算する。

以上より、１回の水平方向の走査による３つの中点３３
．〜３３ｃの存在する各分割領域のメモリの増分がそれ
ぞれ”　１　”となるように分配された。

即ち、第５図（ｂ）のつぶれた垂直サブパターンについ
ては、当該走査方向の黒ランの値に比例して複数の中点
を求め、黒ランを検出した複数の分割領域のメモリの増
分を決定している。その結果、第５図（ａ）のつぶれて
いない垂直サブパターンを走査した場合と同一の内容の
線長マトリクスを得ることができる。他のサブパターン
についても全く同様のことがいえる。

尚、上記実施例では、　（３）式で求めた特徴量の　４増分Ｋから、複数の中点を求めて分割領域に対応するメ
モリのデータを決定している。

しかし、黒ランを検出した各分割領域に対して、上記特
徴量の増分Ｋを適当に均一に分配すれば、同様の線長マ
トリクスが得られる。又、特徴量として必ずしも中点を
求める必要はなく、順に並んだ変化点と分割点の中間に
位置する一定の点を求めれば差し支えない。

（発明の効果）以上詳細に説明したように、本発明の文字認識装置によ
れば、抽出する特徴量を、黒シンと当該原パターンの線
幅とを比較して、その結果に応じた増分を考慮して決定
するので、文字図形パターンにつぶれがある場合でも抽
出する特徴量が変動せず安定となり、高い認識精度を得
ることができる。

【図面の簡単な説明】

第１図は本発明の文字認識装置の実施例を示すブロック
図、第２図は従来の文字図形パターンの特徴抽出方法を
示す説明図、第３図はゴシック体　Ｒ６活字パターンのつぶれの例を示す平面図、第４図は垂直
サブパターンの特徴マトリクス抽出方向の説明図、第５
図は本発明の装置の具体的な動作説明図である。１・・・読取部、２・・・光電変換部、３・・・パター
ンレジスタ、４・・・線幅計算部、５・・・文字枠検出部、６・・・垂直サブパターン抽出部、７・・・水平サブパターン抽出部、８・・・右斜めサブパターン抽出部、９・・・左斜めサブパターン抽出部、１０・・・特徴マトリクス抽出部、１１・・・識別部、
１２・・・文字名出力端子、２０・・・サブパターン抽出部、旧・・・サブパターン切換部、０２・・・黒ラン検出部、０３・・・特徴量増分計算部、０４・・・分割点決定部、０５・・・線長マトリクス演算部、・・・特徴マトリクス作成部。　７サブパターン（ｂ）線長マトリクス（ｃ）従来の文字図形パターンの特徴抽出法第　　２　　図垂直サブパターンの特徴マトリクス抽出法第・１図（ａ）つぶれていないパターンの例０１２３４５（ｂ）つぶれたパターンの例本発明の装置の作用の説明図第　　５　　図

Claims

【特許請求の範囲】認識すべき文字図形パターンを光電変換して量子化し、
黒ビット及び白ビットで表わされるディジタル信号の原
パターンを得る光電変換部と、更に、前記文字図形に外
接する文字枠を設定する文字枠検出部と、前記文字枠内において、前記原パターンの複数の方向に
第１の走査を行なって、前記原パターンから特定の方向
の文字図形成分のみを抽出した複数のサブパターンを作
成するサブパターン抽出部と、前記各サブパターンについて前記特定の方向と異なる方
向に第２の走査を行ない、その走査中で前記黒ビットの連続個数に相当する黒ラン
を検出する黒ラン検出部と、前記黒ランと線幅とを比較して特徴量の増分を求める特
徴量増分計算部と、前記各サブパターンの前記文字枠に囲まれた部分をＭ×
Ｎ個（Ｍ、Ｎは整数）の領域に分割し、各分割領域に対
応させたＭ行Ｎ列のデータから成る線長マトリクスを設
定し、白ビットと黒ビットの変化点を基準に、前記分割
領域内のサブパターンの線長に応じた特徴量を求めて、
前記線長マトリクスの各分割領域に対応するデータを決
定する際に、前記黒ランを検出した分割領域について、
前記特徴量の増分を分配して前記線長マトリクスを得る
線長マトリクス演算部と、こうして得られた前記各サブパターンに対応する線長マ
トリクスに、正規化のための所定の補正演算を行なって
特徴マトリクスを得る特徴マトリクス作成部と、その特徴マトリクスと、標準文字図形パターンについて
用意された標準マトリクスとを比較して、前記原パター
ンに対応する文字図形を識別する識別部とから成ること
を特徴とする文字認識装置。