JPS59127177A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS59127177A
JPS59127177A JP58001439A JP143983A JPS59127177A JP S59127177 A JPS59127177 A JP S59127177A JP 58001439 A JP58001439 A JP 58001439A JP 143983 A JP143983 A JP 143983A JP S59127177 A JPS59127177 A JP S59127177A
Authority
JP
Japan
Prior art keywords
character
stroke
starting point
characters
stored
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP58001439A
Other languages
English (en)
Other versions
JPH0256709B2 (ja
Inventor
Shozo Yamashita
山下 昭蔵
Teruaki Inoue
井上 暉朗
Minoru Nagao
永尾 実
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Tateisi Electronics Co
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tateisi Electronics Co, Omron Tateisi Electronics Co filed Critical Tateisi Electronics Co
Priority to JP58001439A priority Critical patent/JPS59127177A/ja
Publication of JPS59127177A publication Critical patent/JPS59127177A/ja
Publication of JPH0256709B2 publication Critical patent/JPH0256709B2/ja
Granted legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 本発明は、未知の文字や記号等の光学パターン(以下「
未知パターン」という)を自動的に読み取り、標堕パタ
ーンとその特徴を比較して、未知の文字等を認識する文
字認識装置に関する。
〈発明の背景〉 第1図は従来のこの種文字認識装置における動作フロー
を示す。図示例において、用紙10に記録された文字1
1は、ステップ1(以下「5TIJの如く表わす)で光
電変換され、Sr2でIll”0”の2値パターンに変
換される。Sr1では2値パターンにつき、ノイズ処理
や文字図形の境界面の平滑化等、一連の前処理が実行さ
れ、つぎのS′「4で、文字認識を行なうのに必要ない
くつかの特徴(交点、分岐点、ループ数、ストロークの
長さ情報等)を抽出する処理が実行される。この抽出結
果に応じてつぎのSr1で、多数の認識(2) 対象文字より特徴が共通する文字のいくつかが候補文字
として絞り込まれる。この動作を辞書誘導と呼ぶ。この
絞り込みにより第1段階の認識処理が終了し、候補文字
が複数ある場合には、つぎのSr1でその中から唯一の
文字を選択するための詳細な識別処理が実行される。こ
の詳細な識別処理を辞書照合処理と呼ぶ。
辞書照合処理では、辞書7中に予め記憶さ。
れる標準パターンの特徴系列と未知パターンの特徴系列
の一致度を検出する照合処理が実行され(Sr1)、照
合処理結果に基づき、Sr9で読み取った文字が特定さ
れたり、或いは認識不能として認識結果が出力される。
第2図は片仮名文字「ア」の標準パターンD1、第3図
は標準パターンD1を図形化したイメージパターンD2
を夫々示す。片仮名文字「ア」の標準パターンD1は、
3つの端点のと、1個の分岐点■と、番号値で表わされ
る10個の方向成分(ベクトル)とで構成されている。
このベクトル番号値は文字のストローク方向が第3図に
示す0から7までの8方向のいずれの方向であることを
示す。斯くて片仮名文字「ア」にかかる標準パターンD
1は、端点■から始まりベクトル番号値2・1・3・4
・5のストロークを経て分岐点■で終了する要素と、端
点■から始まりベクトル番号値2・3・4・5のストロ
ークを経て端点■で終了する要素とを含んでおり、これ
らの各要素を図示したものが第2図の下段に示しである
登用紙lOに記録された未知文字11が、第1図のST
1〜ST3の各処理を経てパターン化され、システムの
記憶エリアへ第5図に示す太目の文字パターンXlが記
憶された場合を想定する。この文字パターンXlは、第
8図に示す左右方向(Aで示す)、上下方向(Bで示す
)、斜右上り方向(Cで示す)、斜右下り方向(Dで示
す)の4方向に正規化され、第6図に示す如く、文字の
骨格を表ゎす4方向正規化情報X2に変換された後、つ
ぎに文字認識を行なうのに必要ないくつかの特徴(交点
、分岐点、ループ数、ストロークの長さ情報など)を抽
出する処理が実行される。つぎに抽出された未知文字の
特徴を用いて、辞書誘導処理が実行され、候補文字が唯
−或いは複数に絞り込まれる。そして候補文字が複数の
場合には、各候補文字毎に読み取った文字の特徴系列を
得る処理がなされる。
この特徴系列は第2図の標準パターンDlと同様に表現
され、その結果第7図に示す■134■■34■という
特徴系列を有する未知パターンX3を得る。この未知パ
ターンは辞書誘導処理の結果得られた候補文字の標準パ
ターンとその一致度が照合される。この照合処理は、第
9図に示す如く、標準パターンのベクトル番号値と未知
パターンのベクトル番号値とがその値および順序におい
て一致するか等、一定の規則に従って行なわれる。図示
例の場合、未知パターンは標準パターンが有する同一の
ベクトル番号値を含み且つその順番も一致しており、従
って未知パターンは片仮名文字「ア」であると認識゛さ
れ出力される。
ところで従来の文字認識装置において、文字パターンの
方向成分を探索する場合、第10図(1)に示す如く画
面の上方向から探索を開始したり、第10図(2)に示
す如く画面の左方向から探索を開始する等、探索方向の
起点が固定されている。例えば、第11図fil F2
+に示す片仮名文字「ヤ」と「ヌ」を画面の上側から起
点探索して両者のパターン要素を抽出した場合、両者は
共通するパターン要素が前後に入れ替っており、両文字
は確実に識別できる。
ところが第12図(11F21に示す片仮名文字「ユ」
と「ヲ」とを同様の方法でパターン抽出した場合、両者
のパターン要素は同一となり、辞書照合処理にて両文字
を区別できない。この問題に対応するため、従来の文字
認識装置は、他の観点から文字の特徴を抽出した後、別
の識別処理を更に追加しており、これがためかかる追加
識別処理に時間がかかり、その分処理の高速化が阻害さ
れるという欠点があった。
〈発明の目的〉 本発明は、前記探索方向の起点を固定しない新規な文字
認識方式を提案することにより、上記問題点を解消し、
文字識別処理の効率化をはかることを目的とする。
〈発明の構成および効果〉 上記目的を達成するため、本発明では、未知文字の光学
パターンを読み取る読取手段と、読み取られた光学パタ
ーンの特徴を抽出する手段と、抽出された特徴を記憶す
る手段と、抽出された特徴に基づき特徴を共通にする文
字グループを誘導する手段と、各文字毎に固有の標準パ
ターンを記憶すると共に各文字毎に探索方向を示す起点
辺情報と走査時の起点ストロークと位置情報を予め規定
して記憶する辞書記憶手段と、前記誘導手段により誘導
された文字グループの各文字について前記辞書記憶手段
に記憶される起点辺情報と走査時の起点ストロークとそ
の位置情報に基づき前記未知パターンの抽出された特徴
を探索しつつ前記辞書記憶手段に記憶される対応文字の
標準パターンとを比較する照合手段とから構成して、照
合手段の照合結果により未知文字を認識するようにした
本発明によれば、照合処理時に未知文字を起点辺情報に
基づいて定まる方向で走査するから、例えば第12図に
示す片仮名文字「ユ」と「ヲ」とを識別する場合、下方
側から起点探索することによって、文字「ユ」ではパタ
ーン要素■1■、続いて■05■が抽出されるのに対し
、文字「ヲ」ではその逆の順で抽出され、両文字を確実
に識別できる。
また本発明では、起点探索の走査時に起点となるストロ
ークの4方向情報と、更にそのストロークの端点位置を
左、右のように指定するから、第14図+11 +21
 (31に示す如く、左上り、水平、右上りの字画をも
つ同一文字12ついても、複数個の標準パターンを準備
する必要がなく、単一の標準パターンを“もって確実に
文字を識別できる。従って他の特徴による照合処理を施
こす必要性がなくなり、全体的な文字認識の処理効率を
高めることができる等、発明目的を達成した優れた効果
を奏する。
〈実施例の説明〉 第15図は本発明にかかる文字認識装置の回路構成例を
示す。図示例において、用紙12に記録された文字13
はA/D変換器14で光学的に読み取られ、゛ディジタ
ルデータに変換されて画像メモリ15に記憶される。ま
た演算処理装置16は照合処理を含む文字認識処理をプ
ログラムに従い実行し、ストローク検出回路17は読み
取られた文字を例えば第16図に示すように4方向スト
ロークに変換する。
ROM (Read Onl y Memory ) 
l 8は認識対象文字の標準パターン、起点辺情報、起
点ストローク情報を記憶する辞書および各種プログラム
をストアするメモリであり、RAM(Random A
ccess Memory ) 19は入力文字の4方
向ストロークや特徴系列データを記憶すると共にプログ
ラム実行時のワークエリアとして用いられる。RAM1
9の記憶内容は第16図に示すストローク抽出後のイメ
ージに対応して格納されており、その具体的な内容は第
17図に示しである。
第17図において、TERM は文字図形の端点情報を
格納する領域であり、T1〜T4は端点、SA、SCは
A方向、C方向の各ストローク、Slは対応する方向ス
トロークの追番を夫々示す。また、L 、 Rは文字端
点のストロークに対する位置を示し、Lはストロークの
左側に、Rはストロークの右側に夫々端点が存在するこ
とを示す。つぎのCHKNはストローク間の接続情報(
屈折点)が格納される領域であり、図示例ではストロー
ク方向Aの1のk(右側)とストローク方向Cの1のに
側との屈折点として接続されていることを意味している
。ASTMはAストロークの端点の2次元座標アドレス
情報が格納される領域でアリ、C5TMはCストローク
の端点の2次元座標アドレス情報が格納される領域であ
る。
なおストロークの端点の2次元座標アドレス情報を格納
する領域としては、BストロークおよびDストロークの
端点アドレス情報を格納する領域BSTM 、DSTM
  も設けられるが、ここでは第16図の文字例にBス
トローク、Dストロークを含んでいないので図示されて
いない。またPONTはASTM等で検出されたストロ
ーク情報を一時的に格納する領域、SCMは認識対象文
字すなわち未知文字のストロークの8方向に変換された
データを格納する領域である。
第18図はROM13の記憶内容のうち、辞書部分を例
示したものであり、片仮名文字「ユ」を示している。辞
書の各文字格納領域毎に先ず走査の起点辺情報が格納さ
れている。
文字の上側辺を起点刃として走査する場合には起点刃■
、左側辺を起点刃とする場合には起点刃■、同様に起点
刃を下側辺、右側辺とする場合にはそれぞれ起点刃■、
■とじて格納される。したがって図示例では第1回目で
先ず下側辺を起点刃として走査し、第2回目は上側辺を
起点刃として走査することになる。
この起点辺情報のつぎに、起点ストロークの種類、続い
てその端点位置が格納されている。
このストロークの種類はA方向を起点とする場合にはO
1同様にB方向、C方向、D方向とする場合には夫々(
す、o 、 ()として格納される二また、端点位置は
、上記ストロークの左側を起点とする場合にはL1同様
に右側、上側、下側とする場合には夫々R2U、Dとし
て格納される。尚U、DはB方向ストロークの場合にの
み適用され、A方向。
C方向、D方向の場合にはL 、 Rが格納される。
次に上記装置の照合処理動作を第20図に示すフローチ
ャートを参照して説明する。
以下では従来と同様の辞書誘導処理により、候補文字「
ユ」に絞られた場合の照合処理について説明する。
先ず絞られた候補文字「ユ」からROM18の「ユ」の
辞書(第18図)を参照し、第1回目の起点刃番号■を
ロードする(Sr21)。
次にこの起点刃番号■により下側辺からの走査モードを
決定しく Sr12 )、下側辺の左端に相当するアド
レスを走査カウンタに格納して初期化する(Sr23)
次に走査モードにしたがって第16図に示したイメージ
をRAMIQ上で走査する。図示例では、第19図のH
lの如く下辺左側から右端に走査してゆくことになる。
この時各走査点毎にRAM19のASTM領域、C5T
M領域のストローク端点の2次元アドレスと走査カウン
タの座標が一致するか比較される(Sr24)。比較の
結果両座標が一致しない限り走査カウンタが更新されこ
の座標アドレス比較が繰り返される(Sr25,5T2
6,5T24)。
走査カウンタの内容とRAM19の端点2次元アドレス
が一致すると、このストローク端点が8方向変換時の仮
の起点となる。図示例では2次元座標アドレス(30,
28)で一致が成立する。座標(30,28)はAST
Mに格納されているものであり、この結果、この端点は
入方向ストローク(SA)のストローク番号2 (S2
)のk(右側)であることが検出される。この検出結果
はRAM19のPONT領域に、(SA、S2.R)と
して格納される。次にこのFONT領域のデータを参照
してTERM領域中にSA、S2.Rの存在を調べれば
その座標が文字端点であることを知り、更にこの文字端
点を構成するス)ローフ端点(PONT領域内)と辞書
「ユ」(第18図)に格納されている起点ストロークお
よびその位置が一致するか否かが判定される(Sr27
)。および5T27の判定が“NO″の場合、走査カウ
ンタが更新され、座標アドレス比較および上記ストロー
ク端点との比較が繰り返される(Sr25,5T26.
5T24.5T27’)。一方5T27の判定が”YE
S″の場合、8方向変換の起点として■をRAM19の
80M領域に格納する。なお、上記動作でFONT領域
に格納されたデータがTERM領域中区域中されない場
合には、これは検出された座標が文字端点でないことを
示すから、走査カウンタを更新すべ(制御は5T25に
に移される。本実施例においては、前記■は第16図中
の文字端1点T4、すなわちA方向ストロークの右側端
点に相当し、これにより第1回目の8方向変換時の起点
を見い出すことができる。
次に文字端点であることが検出された場合ニハ前記FO
NT領域のストローク情報を用いて、第4図に示す8方
向データ(A方向ストロークで左から右へのストローク
は方向5)に変換し、この方向データ゛5#をRAM1
9の80M領域に格納する( Sr1 B )。
続いてFONT領域に格納したストロークからさらに接
続情報を探すために、このストロークのもう一方のスト
ローク端点情報(SA。
S2.L)にPONT領域を変更する。そして検出され
たA方向ストロークのストローク番号2の左側端(1−
)が文字端点であるか、あるいは屈折点を構成している
かをPONT領域のデータを参照して、文字端点格納領
域TERMおよび屈折点格納領域CHKN内の登録内容
を媚べてチェックする。ワ示例ではTERM領域より(
SA、52.L)を見出すことができ、変更後のストロ
ーク端点は文字端点(T3)であることがわかる。この
結果により8方向変換デ一タ格納領域SCMに■を格納
する( 5T29)。
続いて、ROM13の文字「ユ」の辞書を参照して次の
起点指定があるか判定されるが(Sr30)、図示例で
は第18図に示すように第2番目の起点情報が存在する
のでこの次の起点指定データ(起点辺■)をロードした
後、上記と同様の走査を行なうべく制御を5T22に移
す。なお、上記において8方向変換の終了したストロー
クは変換後適時抹消(RAM19上のASTM、C3T
M領域のストローク番号をスヘースコードに変換)する
。これによって、一度検出されたストロークが重複検出
されることはな(なる( Sr30 )。
第2回目の探索も第1回目の場合と同様起点指定された
データすなわち起点辺データにより走査モードが決定さ
れ(Sr22)、走査カウンタを初期化する(Sr23
)。上記例では2回目の起点辺が■なので第19図のH
2で示す如く、上側辺左側から右側にかけて走査が進め
られることになる。そして上記した第1回目の場合と同
様に走査カウンタを更新しながら走査を行ない、RAM
19のASTM 、 C5TM領域に格納されるストロ
ークの2次元アドレスデータと走査カウンタとを比較す
る(ST24〜5T27 )。第16図に示した例では
アドレス(3,6)で一致が成立する。このアドレス(
3,6)はASTM領域に格納されている。
それゆえこの端点はA方向ストローク(SA)のストロ
ーク番号1(Sl)の左側(L)であることがわかり、
これをRAM19のPONT領域に格納する。そして、
TERM領域中区域中のデータ(SA、Sl、L)が存
在することを調べ、この端点が文字端点であることを知
り二更にこの文字端点を構成するストローク端点(FO
NT領域内)と辞書「ユ」(第18図)に格納されてい
る第2回目の起点ストロークおよびその位置(SA、L
)が一致するか否かが判定され(Sr27−)。5T2
7の判定が“YES”の場合、第2回目の起点として■
をRAM19の80M領域に格納する。次に第1回目と
同様にFONT領域のストローク情報を用いて8方向デ
ータ(方向1)に変換し、この方向データ゛1″を80
M領域に′1″を格納する(ST2B)。
続いて、FONT領域に格納したストロークからさらに
接続情報を探すためにこのストロークのもう一方のスト
ローク端点情報にPONT領域を右側の端点を示す(’
SA、Sl。
R)に変更する。接続有無の確認は、このFONT領域
のデータを参照してTERM領域。
CHKN領域を調べることにより行なうが、図不例では
変更後のストローク端点(SA、Sl−。
k)が(SC,Sl、R)と接続していることがCHK
 N領域でわかる。それゆえ、5T29の接続情報チェ
ックの判定は“YES”と判断される。これに伴いFO
NT領域のストローク情報をこの(SC,51,R)に
変更した後、制御はSr28に移される(Sr29)。
以後文字の端点が検出されるまで5T28および5T2
9が繰返し実行される。その結果この図示例では■5■
■14■がRAM19のSCM領域に格納される。
5T3Qで再び「次の起点指定有か」が判定されるが、
図示例では第2回目までの起点辺7!l(ROM 18
に格納されているのみなので、ここでは判定“No”と
なり、続いてRAM19のSCM領域の内容とROM1
8の辞書の文字「ユ」の標準パターンが比較される( 
Sr12 )。
比較の結果ある一定率以上の一致が得られれば入力文字
を「ユ」と認識する。
【図面の簡単な説明】
第1図は一般的な文字認識装置の概略を説明するための
フローチャート、第2図は文字例「ア」を方向成分に変
換した標準パターン例を説明するための図、第3図は標
準パターンを図形化したイメージパターンを示す図、第
4図は文字のストロークの方向成分を8方向に正規化す
る場合の方向番号を示す図、第5図は文字例「ア」の光
学的に読み取った状態でのパターンを示す図、第6図は
第5図の文字「ア」を細めてストロークの骨格のみを示
した図、第7図は第6図に示す文字「ア」を端点、方向
成分、屈折点で表わす場合を説明するための図、第8図
は4方向成分を説明するための図、第9図は第2図に示
す文字「ア」の標桑パターンと第6図。 第7図に示す入力文字との照合による文字認識動作を説
明するための図、第1011ffi (1)+2)は文
字の探索走査を開始する起点辺を説明する図、第11図
(11+21は文字「ヤ」「ヌ」の−上側辺より走査を
開始した場合の各ストロークの8方向成分パターンを示
す図、第12図(11+21は文字「ユ」「ヲ」の上側
辺より走査を開始した場合の各ストロークのt方向成分
パターンを示す図、第13図fi+ +21は文字「ユ
」「ヲ」の上側辺より走査を開始した場合の各ストロー
クの8方向成分パターンを示す図、第14図(1) (
2+ +31はストロークの4方向正規化時の各ストロ
ークの座標のバラツキを概念的に表わした図、第15図
は本発明の実施にかかる文字認識装置の回路ブロック図
、第16図は第15図に示す文字認識装置に入力される
文字例を示す図、第17図は第15図に示す文字認識装
置のRAMの格納領域配置例を示す図、第18図はRO
Mの辞書格納領域の一文字分のデータ配置例を示す図、
第19図は第18図は基づいて走査が開始される起点辺
を示す図、第20図は第15図に示す文字認識装置の動
作を説明するためのフローチャートである。 14・・・・・・A/D変換器 15・・・・・・画像
メモリ16・・・・・・演算処理装置 17・・・・・・ストローク検出回路

Claims (1)

  1. 【特許請求の範囲】 未知文字の光学パターンを読み取る読取手段と、読み取
    られた光学パターンの特徴を抽出する手段と、抽出され
    た特徴を記憶する手段と、抽出された特徴に基づき特徴
    を共通にする文字グループを誘導する手段と、各文字毎
    に固有の標準パターンを記憶すると共に各文字毎に探索
    方向を示す起点辺情報と走査時の起点ストロークと位置
    情報を予め規定して記憶する辞書記憶手段と、前記誘導
    手段により誘導された文字グループの各文字について前
    記辞薔記憶手段に記憶される起点辺情報と走査時の起点
    ストロークとその位置情報に基つき前記未知パターンの
    抽出された特徴を探索しつつ前記辞薔記憶手段に記憶さ
    れる対応文字の標準パターンとを比較する照合手段とを
    具備して成る文字認識装置。 (1)
JP58001439A 1983-01-08 1983-01-08 文字認識装置 Granted JPS59127177A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP58001439A JPS59127177A (ja) 1983-01-08 1983-01-08 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP58001439A JPS59127177A (ja) 1983-01-08 1983-01-08 文字認識装置

Publications (2)

Publication Number Publication Date
JPS59127177A true JPS59127177A (ja) 1984-07-21
JPH0256709B2 JPH0256709B2 (ja) 1990-11-30

Family

ID=11501469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP58001439A Granted JPS59127177A (ja) 1983-01-08 1983-01-08 文字認識装置

Country Status (1)

Country Link
JP (1) JPS59127177A (ja)

Also Published As

Publication number Publication date
JPH0256709B2 (ja) 1990-11-30

Similar Documents

Publication Publication Date Title
CA2194491C (en) Character recognition system identification of scanned and real time handwritten characters
US4972499A (en) Pattern recognition apparatus
US6052482A (en) Character recognition apparatus and method
US4979226A (en) Code sequence matching method and apparatus
JPS59127177A (ja) 文字認識装置
JPH067394B2 (ja) パターン認識装置
JPS5933584A (ja) 文字認識装置
JPS60164882A (ja) 文字認識装置
JPH067392B2 (ja) 文字認識装置
JP4805485B2 (ja) 単語認識方法および単語認識装置
JPS60225984A (ja) 文字認識装置
JPS60204088A (ja) 文字認識装置
JPS61121184A (ja) 文字認識装置
JPH04280394A (ja) 文字認識装置及び認識文字確定方法
JPS60217479A (ja) 文字認識装置
JPH0488481A (ja) シンボル候補領域の検出方法
JPH02217981A (ja) オンライン手書文字認識装置
JPH04216171A (ja) 輪郭ベクトルの抽出方法
JPH01129368A (ja) 画像認識装置
JP2002222389A (ja) 追加テンプレートの作成方法、追加テンプレートの作成をコンピュータにより実現させるプログラムおよびocr認識辞書作成装置
JPS61123987A (ja) 文字認識装置
JPH02311968A (ja) 図面認識装置
JPH0793544A (ja) 図面自動認識装置の寸法線認識方法
JPH07120361B2 (ja) 機械図面の接触記号分離方式
JPH0620094A (ja) 文字認識装置