JPS59127177A

JPS59127177A - 文字認識装置

Info

Publication number: JPS59127177A
Application number: JP58001439A
Authority: JP
Inventors: Shozo Yamashita; 山下　昭蔵; Teruaki Inoue; 井上　暉朗; Minoru Nagao; 永尾　実
Original assignee: Tateisi Electronics Co; Omron Tateisi Electronics Co
Current assignee: Omron Corp
Priority date: 1983-01-08
Filing date: 1983-01-08
Publication date: 1984-07-21
Also published as: JPH0256709B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〈発明の技術分野〉本発明は、未知の文字や記号等の光学パターン（以下「
未知パターン」という）を自動的に読み取り、標堕パタ
ーンとその特徴を比較して、未知の文字等を認識する文
字認識装置に関する。

〈発明の背景〉第１図は従来のこの種文字認識装置における動作フロー
を示す。図示例において、用紙１０に記録された文字１
１は、ステップ１（以下「５ＴＩＪの如く表わす）で光
電変換され、Ｓｒ２でＩｌｌ”０”の２値パターンに変
換される。Ｓｒ１では２値パターンにつき、ノイズ処理
や文字図形の境界面の平滑化等、一連の前処理が実行さ
れ、つぎのＳ′「４で、文字認識を行なうのに必要ない
くつかの特徴（交点、分岐点、ループ数、ストロークの
長さ情報等）を抽出する処理が実行される。この抽出結
果に応じてつぎのＳｒ１で、多数の認識（２）対象文字より特徴が共通する文字のいくつかが候補文字
として絞り込まれる。この動作を辞書誘導と呼ぶ。この
絞り込みにより第１段階の認識処理が終了し、候補文字
が複数ある場合には、つぎのＳｒ１でその中から唯一の
文字を選択するための詳細な識別処理が実行される。こ
の詳細な識別処理を辞書照合処理と呼ぶ。

辞書照合処理では、辞書７中に予め記憶さ。

れる標準パターンの特徴系列と未知パターンの特徴系列
の一致度を検出する照合処理が実行され（Ｓｒ１）、照
合処理結果に基づき、Ｓｒ９で読み取った文字が特定さ
れたり、或いは認識不能として認識結果が出力される。

第２図は片仮名文字「ア」の標準パターンＤ１、第３図
は標準パターンＤ１を図形化したイメージパターンＤ２
を夫々示す。片仮名文字「ア」の標準パターンＤ１は、
３つの端点のと、１個の分岐点■と、番号値で表わされ
る１０個の方向成分（ベクトル）とで構成されている。

このベクトル番号値は文字のストローク方向が第３図に
示す０から７までの８方向のいずれの方向であることを
示す。斯くて片仮名文字「ア」にかかる標準パターンＤ
１は、端点■から始まりベクトル番号値２・１・３・４
・５のストロークを経て分岐点■で終了する要素と、端
点■から始まりベクトル番号値２・３・４・５のストロ
ークを経て端点■で終了する要素とを含んでおり、これ
らの各要素を図示したものが第２図の下段に示しである
。

登用紙ｌＯに記録された未知文字１１が、第１図のＳＴ
１〜ＳＴ３の各処理を経てパターン化され、システムの
記憶エリアへ第５図に示す太目の文字パターンＸｌが記
憶された場合を想定する。この文字パターンＸｌは、第
８図に示す左右方向（Ａで示す）、上下方向（Ｂで示す
）、斜右上り方向（Ｃで示す）、斜右下り方向（Ｄで示
す）の４方向に正規化され、第６図に示す如く、文字の
骨格を表ゎす４方向正規化情報Ｘ２に変換された後、つ
ぎに文字認識を行なうのに必要ないくつかの特徴（交点
、分岐点、ループ数、ストロークの長さ情報など）を抽
出する処理が実行される。つぎに抽出された未知文字の
特徴を用いて、辞書誘導処理が実行され、候補文字が唯
−或いは複数に絞り込まれる。そして候補文字が複数の
場合には、各候補文字毎に読み取った文字の特徴系列を
得る処理がなされる。

この特徴系列は第２図の標準パターンＤｌと同様に表現
され、その結果第７図に示す■１３４■■３４■という
特徴系列を有する未知パターンＸ３を得る。この未知パ
ターンは辞書誘導処理の結果得られた候補文字の標準パ
ターンとその一致度が照合される。この照合処理は、第
９図に示す如く、標準パターンのベクトル番号値と未知
パターンのベクトル番号値とがその値および順序におい
て一致するか等、一定の規則に従って行なわれる。図示
例の場合、未知パターンは標準パターンが有する同一の
ベクトル番号値を含み且つその順番も一致しており、従
って未知パターンは片仮名文字「ア」であると認識゛さ
れ出力される。

ところで従来の文字認識装置において、文字パターンの
方向成分を探索する場合、第１０図（１）に示す如く画
面の上方向から探索を開始したり、第１０図（２）に示
す如く画面の左方向から探索を開始する等、探索方向の
起点が固定されている。例えば、第１１図ｆｉｌ　Ｆ２
＋に示す片仮名文字「ヤ」と「ヌ」を画面の上側から起
点探索して両者のパターン要素を抽出した場合、両者は
共通するパターン要素が前後に入れ替っており、両文字
は確実に識別できる。

ところが第１２図（１１Ｆ２１に示す片仮名文字「ユ」
と「ヲ」とを同様の方法でパターン抽出した場合、両者
のパターン要素は同一となり、辞書照合処理にて両文字
を区別できない。この問題に対応するため、従来の文字
認識装置は、他の観点から文字の特徴を抽出した後、別
の識別処理を更に追加しており、これがためかかる追加
識別処理に時間がかかり、その分処理の高速化が阻害さ
れるという欠点があった。

〈発明の目的〉本発明は、前記探索方向の起点を固定しない新規な文字
認識方式を提案することにより、上記問題点を解消し、
文字識別処理の効率化をはかることを目的とする。

〈発明の構成および効果〉上記目的を達成するため、本発明では、未知文字の光学
パターンを読み取る読取手段と、読み取られた光学パタ
ーンの特徴を抽出する手段と、抽出された特徴を記憶す
る手段と、抽出された特徴に基づき特徴を共通にする文
字グループを誘導する手段と、各文字毎に固有の標準パ
ターンを記憶すると共に各文字毎に探索方向を示す起点
辺情報と走査時の起点ストロークと位置情報を予め規定
して記憶する辞書記憶手段と、前記誘導手段により誘導
された文字グループの各文字について前記辞書記憶手段
に記憶される起点辺情報と走査時の起点ストロークとそ
の位置情報に基づき前記未知パターンの抽出された特徴
を探索しつつ前記辞書記憶手段に記憶される対応文字の
標準パターンとを比較する照合手段とから構成して、照
合手段の照合結果により未知文字を認識するようにした
。

本発明によれば、照合処理時に未知文字を起点辺情報に
基づいて定まる方向で走査するから、例えば第１２図に
示す片仮名文字「ユ」と「ヲ」とを識別する場合、下方
側から起点探索することによって、文字「ユ」ではパタ
ーン要素■１■、続いて■０５■が抽出されるのに対し
、文字「ヲ」ではその逆の順で抽出され、両文字を確実
に識別できる。

また本発明では、起点探索の走査時に起点となるストロ
ークの４方向情報と、更にそのストロークの端点位置を
左、右のように指定するから、第１４図＋１１　＋２１
　（３１に示す如く、左上り、水平、右上りの字画をも
つ同一文字１２ついても、複数個の標準パターンを準備
する必要がなく、単一の標準パターンを“もって確実に
文字を識別できる。従って他の特徴による照合処理を施
こす必要性がなくなり、全体的な文字認識の処理効率を
高めることができる等、発明目的を達成した優れた効果
を奏する。

〈実施例の説明〉第１５図は本発明にかかる文字認識装置の回路構成例を
示す。図示例において、用紙１２に記録された文字１３
はＡ／Ｄ変換器１４で光学的に読み取られ、゛ディジタ
ルデータに変換されて画像メモリ１５に記憶される。ま
た演算処理装置１６は照合処理を含む文字認識処理をプ
ログラムに従い実行し、ストローク検出回路１７は読み
取られた文字を例えば第１６図に示すように４方向スト
ロークに変換する。

ＲＯＭ　（Ｒｅａｄ　Ｏｎｌ　ｙ　Ｍｅｍｏｒｙ　）　
ｌ　８は認識対象文字の標準パターン、起点辺情報、起
点ストローク情報を記憶する辞書および各種プログラム
をストアするメモリであり、ＲＡＭ（Ｒａｎｄｏｍ　Ａ
ｃｃｅｓｓ　Ｍｅｍｏｒｙ　）　１９は入力文字の４方
向ストロークや特徴系列データを記憶すると共にプログ
ラム実行時のワークエリアとして用いられる。ＲＡＭ１
９の記憶内容は第１６図に示すストローク抽出後のイメ
ージに対応して格納されており、その具体的な内容は第
１７図に示しである。

第１７図において、ＴＥＲＭ　は文字図形の端点情報を
格納する領域であり、Ｔ１〜Ｔ４は端点、ＳＡ、ＳＣは
Ａ方向、Ｃ方向の各ストローク、Ｓｌは対応する方向ス
トロークの追番を夫々示す。また、Ｌ　、　Ｒは文字端
点のストロークに対する位置を示し、Ｌはストロークの
左側に、Ｒはストロークの右側に夫々端点が存在するこ
とを示す。つぎのＣＨＫＮはストローク間の接続情報（
屈折点）が格納される領域であり、図示例ではストロー
ク方向Ａの１のｋ（右側）とストローク方向Ｃの１のに
側との屈折点として接続されていることを意味している
。ＡＳＴＭはＡストロークの端点の２次元座標アドレス
情報が格納される領域でアリ、Ｃ５ＴＭはＣストローク
の端点の２次元座標アドレス情報が格納される領域であ
る。

なおストロークの端点の２次元座標アドレス情報を格納
する領域としては、ＢストロークおよびＤストロークの
端点アドレス情報を格納する領域ＢＳＴＭ　、ＤＳＴＭ
　　も設けられるが、ここでは第１６図の文字例にＢス
トローク、Ｄストロークを含んでいないので図示されて
いない。またＰＯＮＴはＡＳＴＭ等で検出されたストロ
ーク情報を一時的に格納する領域、ＳＣＭは認識対象文
字すなわち未知文字のストロークの８方向に変換された
データを格納する領域である。

第１８図はＲＯＭ１３の記憶内容のうち、辞書部分を例
示したものであり、片仮名文字「ユ」を示している。辞
書の各文字格納領域毎に先ず走査の起点辺情報が格納さ
れている。

文字の上側辺を起点刃として走査する場合には起点刃■
、左側辺を起点刃とする場合には起点刃■、同様に起点
刃を下側辺、右側辺とする場合にはそれぞれ起点刃■、
■とじて格納される。したがって図示例では第１回目で
先ず下側辺を起点刃として走査し、第２回目は上側辺を
起点刃として走査することになる。

この起点辺情報のつぎに、起点ストロークの種類、続い
てその端点位置が格納されている。

このストロークの種類はＡ方向を起点とする場合にはＯ
１同様にＢ方向、Ｃ方向、Ｄ方向とする場合には夫々（
す、ｏ　、　（）として格納される二また、端点位置は
、上記ストロークの左側を起点とする場合にはＬ１同様
に右側、上側、下側とする場合には夫々Ｒ２Ｕ、Ｄとし
て格納される。尚Ｕ、ＤはＢ方向ストロークの場合にの
み適用され、Ａ方向。

Ｃ方向、Ｄ方向の場合にはＬ　、　Ｒが格納される。

次に上記装置の照合処理動作を第２０図に示すフローチ
ャートを参照して説明する。

以下では従来と同様の辞書誘導処理により、候補文字「
ユ」に絞られた場合の照合処理について説明する。

先ず絞られた候補文字「ユ」からＲＯＭ１８の「ユ」の
辞書（第１８図）を参照し、第１回目の起点刃番号■を
ロードする（Ｓｒ２１）。

次にこの起点刃番号■により下側辺からの走査モードを
決定しく　Ｓｒ１２　）、下側辺の左端に相当するアド
レスを走査カウンタに格納して初期化する（Ｓｒ２３）
。

次に走査モードにしたがって第１６図に示したイメージ
をＲＡＭＩＱ上で走査する。図示例では、第１９図のＨ
ｌの如く下辺左側から右端に走査してゆくことになる。

この時各走査点毎にＲＡＭ１９のＡＳＴＭ領域、Ｃ５Ｔ
Ｍ領域のストローク端点の２次元アドレスと走査カウン
タの座標が一致するか比較される（Ｓｒ２４）。比較の
結果両座標が一致しない限り走査カウンタが更新されこ
の座標アドレス比較が繰り返される（Ｓｒ２５，５Ｔ２
６，５Ｔ２４）。

走査カウンタの内容とＲＡＭ１９の端点２次元アドレス
が一致すると、このストローク端点が８方向変換時の仮
の起点となる。図示例では２次元座標アドレス（３０，
２８）で一致が成立する。座標（３０，２８）はＡＳＴ
Ｍに格納されているものであり、この結果、この端点は
入方向ストローク（ＳＡ）のストローク番号２　（Ｓ２
）のｋ（右側）であることが検出される。この検出結果
はＲＡＭ１９のＰＯＮＴ領域に、（ＳＡ、Ｓ２．Ｒ）と
して格納される。次にこのＦＯＮＴ領域のデータを参照
してＴＥＲＭ領域中にＳＡ、Ｓ２．Ｒの存在を調べれば
その座標が文字端点であることを知り、更にこの文字端
点を構成するス）ローフ端点（ＰＯＮＴ領域内）と辞書
「ユ」（第１８図）に格納されている起点ストロークお
よびその位置が一致するか否かが判定される（Ｓｒ２７
）。および５Ｔ２７の判定が“ＮＯ″の場合、走査カウ
ンタが更新され、座標アドレス比較および上記ストロー
ク端点との比較が繰り返される（Ｓｒ２５，５Ｔ２６．
５Ｔ２４．５Ｔ２７’）。一方５Ｔ２７の判定が”ＹＥ
Ｓ″の場合、８方向変換の起点として■をＲＡＭ１９の
８０Ｍ領域に格納する。なお、上記動作でＦＯＮＴ領域
に格納されたデータがＴＥＲＭ領域中区域中されない場
合には、これは検出された座標が文字端点でないことを
示すから、走査カウンタを更新すべ（制御は５Ｔ２５に
に移される。本実施例においては、前記■は第１６図中
の文字端１点Ｔ４、すなわちＡ方向ストロークの右側端
点に相当し、これにより第１回目の８方向変換時の起点
を見い出すことができる。

次に文字端点であることが検出された場合ニハ前記ＦＯ
ＮＴ領域のストローク情報を用いて、第４図に示す８方
向データ（Ａ方向ストロークで左から右へのストローク
は方向５）に変換し、この方向データ゛５＃をＲＡＭ１
９の８０Ｍ領域に格納する（　Ｓｒ１　Ｂ　）。

続いてＦＯＮＴ領域に格納したストロークからさらに接
続情報を探すために、このストロークのもう一方のスト
ローク端点情報（ＳＡ。

Ｓ２．Ｌ）にＰＯＮＴ領域を変更する。そして検出され
たＡ方向ストロークのストローク番号２の左側端（１−
）が文字端点であるか、あるいは屈折点を構成している
かをＰＯＮＴ領域のデータを参照して、文字端点格納領
域ＴＥＲＭおよび屈折点格納領域ＣＨＫＮ内の登録内容
を媚べてチェックする。ワ示例ではＴＥＲＭ領域より（
ＳＡ、５２．Ｌ）を見出すことができ、変更後のストロ
ーク端点は文字端点（Ｔ３）であることがわかる。この
結果により８方向変換デ一タ格納領域ＳＣＭに■を格納
する（　５Ｔ２９）。

続いて、ＲＯＭ１３の文字「ユ」の辞書を参照して次の
起点指定があるか判定されるが（Ｓｒ３０）、図示例で
は第１８図に示すように第２番目の起点情報が存在する
のでこの次の起点指定データ（起点辺■）をロードした
後、上記と同様の走査を行なうべく制御を５Ｔ２２に移
す。なお、上記において８方向変換の終了したストロー
クは変換後適時抹消（ＲＡＭ１９上のＡＳＴＭ、Ｃ３Ｔ
Ｍ領域のストローク番号をスヘースコードに変換）する
。これによって、一度検出されたストロークが重複検出
されることはな（なる（　Ｓｒ３０　）。

第２回目の探索も第１回目の場合と同様起点指定された
データすなわち起点辺データにより走査モードが決定さ
れ（Ｓｒ２２）、走査カウンタを初期化する（Ｓｒ２３
）。上記例では２回目の起点辺が■なので第１９図のＨ
２で示す如く、上側辺左側から右側にかけて走査が進め
られることになる。そして上記した第１回目の場合と同
様に走査カウンタを更新しながら走査を行ない、ＲＡＭ
１９のＡＳＴＭ　、　Ｃ５ＴＭ領域に格納されるストロ
ークの２次元アドレスデータと走査カウンタとを比較す
る（ＳＴ２４〜５Ｔ２７　）。第１６図に示した例では
アドレス（３，６）で一致が成立する。このアドレス（
３，６）はＡＳＴＭ領域に格納されている。

それゆえこの端点はＡ方向ストローク（ＳＡ）のストロ
ーク番号１（Ｓｌ）の左側（Ｌ）であることがわかり、
これをＲＡＭ１９のＰＯＮＴ領域に格納する。そして、
ＴＥＲＭ領域中区域中のデータ（ＳＡ、Ｓｌ、Ｌ）が存
在することを調べ、この端点が文字端点であることを知
り二更にこの文字端点を構成するストローク端点（ＦＯ
ＮＴ領域内）と辞書「ユ」（第１８図）に格納されてい
る第２回目の起点ストロークおよびその位置（ＳＡ、Ｌ
）が一致するか否かが判定され（Ｓｒ２７−）。５Ｔ２
７の判定が“ＹＥＳ”の場合、第２回目の起点として■
をＲＡＭ１９の８０Ｍ領域に格納する。次に第１回目と
同様にＦＯＮＴ領域のストローク情報を用いて８方向デ
ータ（方向１）に変換し、この方向データ゛１″を８０
Ｍ領域に′１″を格納する（ＳＴ２Ｂ）。

続いて、ＦＯＮＴ領域に格納したストロークからさらに
接続情報を探すためにこのストロークのもう一方のスト
ローク端点情報にＰＯＮＴ領域を右側の端点を示す（’
ＳＡ、Ｓｌ。

Ｒ）に変更する。接続有無の確認は、このＦＯＮＴ領域
のデータを参照してＴＥＲＭ領域。

ＣＨＫＮ領域を調べることにより行なうが、図不例では
変更後のストローク端点（ＳＡ、Ｓｌ−。

ｋ）が（ＳＣ，Ｓｌ、Ｒ）と接続していることがＣＨＫ
　Ｎ領域でわかる。それゆえ、５Ｔ２９の接続情報チェ
ックの判定は“ＹＥＳ”と判断される。これに伴いＦＯ
ＮＴ領域のストローク情報をこの（ＳＣ，５１，Ｒ）に
変更した後、制御はＳｒ２８に移される（Ｓｒ２９）。

以後文字の端点が検出されるまで５Ｔ２８および５Ｔ２
９が繰返し実行される。その結果この図示例では■５■
■１４■がＲＡＭ１９のＳＣＭ領域に格納される。

５Ｔ３Ｑで再び「次の起点指定有か」が判定されるが、
図示例では第２回目までの起点辺７！ｌ（ＲＯＭ　１８
に格納されているのみなので、ここでは判定“Ｎｏ”と
なり、続いてＲＡＭ１９のＳＣＭ領域の内容とＲＯＭ１
８の辞書の文字「ユ」の標準パターンが比較される（　
Ｓｒ１２　）。

比較の結果ある一定率以上の一致が得られれば入力文字
を「ユ」と認識する。

【図面の簡単な説明】

第１図は一般的な文字認識装置の概略を説明するための
フローチャート、第２図は文字例「ア」を方向成分に変
換した標準パターン例を説明するための図、第３図は標
準パターンを図形化したイメージパターンを示す図、第
４図は文字のストロークの方向成分を８方向に正規化す
る場合の方向番号を示す図、第５図は文字例「ア」の光
学的に読み取った状態でのパターンを示す図、第６図は
第５図の文字「ア」を細めてストロークの骨格のみを示
した図、第７図は第６図に示す文字「ア」を端点、方向
成分、屈折点で表わす場合を説明するための図、第８図
は４方向成分を説明するための図、第９図は第２図に示
す文字「ア」の標桑パターンと第６図。第７図に示す入力文字との照合による文字認識動作を説
明するための図、第１０１１ｆｆｉ　（１）＋２）は文
字の探索走査を開始する起点辺を説明する図、第１１図
（１１＋２１は文字「ヤ」「ヌ」の−上側辺より走査を
開始した場合の各ストロークの８方向成分パターンを示
す図、第１２図（１１＋２１は文字「ユ」「ヲ」の上側
辺より走査を開始した場合の各ストロークのｔ方向成分
パターンを示す図、第１３図ｆｉ＋　＋２１は文字「ユ
」「ヲ」の上側辺より走査を開始した場合の各ストロー
クの８方向成分パターンを示す図、第１４図（１）　（
２＋　＋３１はストロークの４方向正規化時の各ストロ
ークの座標のバラツキを概念的に表わした図、第１５図
は本発明の実施にかかる文字認識装置の回路ブロック図
、第１６図は第１５図に示す文字認識装置に入力される
文字例を示す図、第１７図は第１５図に示す文字認識装
置のＲＡＭの格納領域配置例を示す図、第１８図はＲＯ
Ｍの辞書格納領域の一文字分のデータ配置例を示す図、
第１９図は第１８図は基づいて走査が開始される起点辺
を示す図、第２０図は第１５図に示す文字認識装置の動
作を説明するためのフローチャートである。１４・・・・・・Ａ／Ｄ変換器　１５・・・・・・画像
メモリ１６・・・・・・演算処理装置１７・・・・・・ストローク検出回路

Claims

【特許請求の範囲】未知文字の光学パターンを読み取る読取手段と、読み取
られた光学パターンの特徴を抽出する手段と、抽出され
た特徴を記憶する手段と、抽出された特徴に基づき特徴
を共通にする文字グループを誘導する手段と、各文字毎
に固有の標準パターンを記憶すると共に各文字毎に探索
方向を示す起点辺情報と走査時の起点ストロークと位置
情報を予め規定して記憶する辞書記憶手段と、前記誘導
手段により誘導された文字グループの各文字について前
記辞薔記憶手段に記憶される起点辺情報と走査時の起点
ストロークとその位置情報に基つき前記未知パターンの
抽出された特徴を探索しつつ前記辞薔記憶手段に記憶さ
れる対応文字の標準パターンとを比較する照合手段とを
具備して成る文字認識装置。（１）