JPH067394B2 - パターン認識装置 - Google Patents

パターン認識装置

Info

Publication number
JPH067394B2
JPH067394B2 JP59146382A JP14638284A JPH067394B2 JP H067394 B2 JPH067394 B2 JP H067394B2 JP 59146382 A JP59146382 A JP 59146382A JP 14638284 A JP14638284 A JP 14638284A JP H067394 B2 JPH067394 B2 JP H067394B2
Authority
JP
Japan
Prior art keywords
pattern
character
standard
stroke
partial
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59146382A
Other languages
English (en)
Other versions
JPS6125284A (ja
Inventor
実 永尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Tateisi Electronics Co filed Critical Omron Tateisi Electronics Co
Priority to JP59146382A priority Critical patent/JPH067394B2/ja
Publication of JPS6125284A publication Critical patent/JPS6125284A/ja
Publication of JPH067394B2 publication Critical patent/JPH067394B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 <発明の技術分野> 本発明は、未知のカナ,英字,数字等の認識対象を自動
的に読み取って認識するパターン認識装置に関する。
<発明の背景> 従来この種のパターン認識装置では、第6図のフローチ
ャートに示す如く、用紙P上の文字を1文字毎に光電変
換し、これをさらに“1”,“0”の2値パターンに変
換している。続いて上記2値パターンにつき後の処理を
効果的にするための前処理、すなわち文字が記憶されて
いる用紙P上の黒点などのノイズ処理や文字図形境界面
の平滑化などを含む一連の処理がなされる。次にパター
ン認識を行なうのに必要ないくつかの特徴(交点、分岐
点、ループ数、ストロークの長さ情報など)を抽出する
特徴抽出処理が行なわれる。この抽出結果に応じて多数
の文字より特徴が共通する文字のいくつかが候補文字と
して絞り込まれる。この絞り込みにより第1段階の認識
が終了するが、候補文字が複数ある場合にはさらにその
中から唯一の文字の選択を行なうための詳細な識別処理
がなされる。この詳細な識別処理は一般には辞書照合処
理といわれる。ここで辞書とは各文字の特徴を一定の系
列で格納したもので通常ROMで構成されている。それ
ゆえ上述した候補文字の絞り込みは、特徴抽出によって
得られた特徴群にもとづき、辞書の中から特定の文字群
を選定することをいい、辞書誘導処理と呼ばれる。
上述したようにこの辞書誘導処理に続いて、辞書中に予
め記憶される各文字の標準となる特徴系列(以下標準パ
ターンという)と認識対象文字の対応する特徴系列の一
致度を検出する照合処理がなされる。この照合処理結果
にもとづき読取った文字が特定されたり、あるいは認識
不能とされたりして認識結果が出力される。
次に辞書の一例について説明する。
第7図(A)は、同図(B)のカナ文字「ア」の標準パターン
D1を図形化したものであり、ここに示した標準パター
ンD1が辞書として記憶されている。すなわちこの辞書
において文字「ア」は、3つの端点と、1個の分岐点
と、番号値で表わされる10個の方向成分(ベクト
ル)とで構成されている。なおここに示すベクトル番号
値は文字のストローク方向がそれぞれ第8図に示す0か
ら7までの8方向のいずれの方向であるかを区別するた
めのものである。したがって上記標準パターンD1は文
字「ア」が端点から始まって2・1・2・3・4・5
というベクトルをこの順番で有した後分岐点で終了す
る要素と、端点から始まりベクトル2・3・4・5お
よび端点をこの順番で有する要素とを含むことを示し
ている。これらの各要素を図示したものが第7図(B)の
下段に示すものである。
ここで、第6図のフローチャートで説明したパターン認
識装置につきより具体的な処理手順を上記した第7図お
よび、第9図ないし第13図を用いて説明する。
用紙Pから読取られた文字は2値化処理後、前処理され
て、画像メモリに記憶される。ここで記憶される文字パ
ターンは第9図に示すように筆跡そのままの太目のもの
である。この太目の文字パターンはいわゆる細め等の処
理が施され、第10図に示すように文字の骨格を示す情
報に変換される。この変換にあたって前記骨格は、第1
1図に示すA(左右)、B(上下)、C(斜右上り)、
D(斜右下り)の4方向に正規化される。ここで行なう
正規化は第8図に示した8方向成分への区別を容易にす
るためのもので、この変換処理に続いて読取った文字の
特徴を得る処理がなされる。この処理では、複数の文字
特徴(ループ、交点、分岐点、端点等)が抽出され、つ
ぎにこれら文字特徴を用いて辞書誘導処理が実施され
る。その結果いくつかの候補文字に絞られると、つぎに
未知文字の特徴系列を求め、各候補文字の標準パターン
と辞書照合する。この特徴系列は、辞書すなわち第7図
(B)の標準パターンD1と同様に表現され、その結果、
第12図に示すような13434という特徴系
列が得られる。この特徴系列は読取対象文字すなわち未
知の文字のパターンを示すものであるから、以下未知パ
ターンと呼ぶ。
以上のようにして得られた未知パターンは辞書誘導処理
の結果得られた各候補文字の標準パターンとその一致度
が照合される。今第12図に示す未知パターンと、第7
図(B)に示す「ア」の標準パターンとが照合されたとす
ると、この照合処理は第13図に示すように、標準パタ
ーン中の方向成分の順番と未知パターンの方向成分の順
番とが一致しているか等、一定の規則にしたがって行な
われる。この例の場合、未知パターンの方向成分は標準
パターンが持つ方向成分にすべて含まれ、かつ順番も一
致しているので、未知パターンはカナ文字「ア」として
認識され出力される。
一般的なパターン認識装置においては、以上のようにし
てパターン認識がなされるが、上記説明で理解できるよ
うにパターン認識における照合処理においては、未知パ
ターンを構成している方向成分の数やその順番が重要で
あることがわかる。
ところで第14図および第15図に示す未知文字「A」
および「P」の場合、この両者の文字特徴を抽出して比
較すると、端点数、分岐点数、連結数等の各特徴が共に
一致している。従ってこれら文字については、辞書誘導
処理の結果、「A」および「P」の両文字が候補文字と
して絞り込まれることになる。このような場合、従来の
パターン認識装置においては、未知パターンと各候補文
字「A」「P」の標準パターンとの照合処理を画一的に
実行しており、これがため辞書照合動作の時間が長くか
かり、処理効率の低下を招く等の問題があった。
<発明の目的> 本発明は、上記した従来のパターン認識装置の欠点を解
消し、辞書照合の処理時間を短縮し、高速且つ高精度の
パターン認識装置を提供することを目的とする。
<発明の構成および効果> 上記目的を達成するため、本発明のパターン認識装置
は、認識対象を光学的に読み取って認識対象に対応する
パターンを求める入力手段と、前記入力手段で求められ
たパターンの特徴を抽出する特徴抽出手段と、前記特徴
抽出手段で抽出された特徴と類似した特徴を有する標準
パターンの候補を取り出す候補取出手段と、前記入力手
段で求められたパターンをラスター走査しつつ所定の条
件を満たす部分パターンを抽出する部分パターン抽出手
段と、各標準パターン毎に未検出の部分パターンの検出
を行うか否かを指定する探索指定情報を記憶する探索指
定情報記憶手段と、前記候補取出手段で取り出された標
準パターンの候補の中から前記入力手段で求められたパ
ターンに該当するものを判別するパターン判別手段とを
備えたものである。
前記パターン判別手段は、前記候補取出手段で取り出さ
れた標準パターンの候補についての探索指定情報が未検
出の部分パターンの検出を行わないことを指定している
場合には、前記部分パターン抽出手段で抽出された部分
パターンと前記標準パターンとを照合することにより、
標準パターンの候補の中から入力パターンに該当するも
のを判別し、前記候補取出手段で取り出された標準パタ
ーンの候補についての探索指定情報が未検出の部分パタ
ーンの検出を行うことを指定している場合には、前記部
分パターン抽出手段で抽出されない部分パターンの有無
により、前記標準パターンの候補の中から入力パターン
に該当するものを判別する。
通常未知文字の特徴系列(未知パターン)を求める場
合、例えば第16図に示す如く、文字の上側から文字端
点探索の走査を開始し、文字端点を検出したとき、その
文字端点からストローク追跡を行ない、文字端点や分岐
点で追跡を完了させている。かくして第14図の未知文
字「A」については第17図(1)で示す文字の一部分の
ストローク追跡が実行され、また第15図の未知文字
「P」については第18図(1)(2)に示す文字全部のスト
ローク追跡が実行されることになる。従って本発明の実
施により、文字「A」「P」について未検出の部分パタ
ーンの探索を指定したとき、未知文字「A」では第17
図(2)に示す未追跡ストロークが存在しており、この未
検出の部分パターンの有無からこれら両文字の区別が可
能である。よって本発明によれば、辞書誘導処理の結
果、絞り込まれた候補文字の中から辞書照合処理に入る
前の段階で認識対象を識別できる場合があり、辞書照合
動作の時間を短縮し得、処理効率の向上に貢献する等、
発明目的を達成した結果を奏する。
<実施例の説明> 第1図は本発明にかかるパターン認識装置を示し、用紙
P上の文字はA/D変換回路1で光学的に読取られデジ
タルデータに変換されCPU3により骨格化されて画像
メモリ2に記憶される。A/D変換回路1にはCPU3
およびストローク検出回路4が結合されており、CPU
3は照合処理を含むパターン認識処理をプログラムにし
たがい実行し、またストローク検出回路4は読取られた
文字をたとえば第2図に示すように4方向ストロークに
変換する。なお、第2図は入力される文字の2値化パタ
ーンを画像メモリ2に格納した例を示すもので、便宜上
後述するRAM6に格納される認識文字の特徴データを
図示している。また第1図中、ROM5は認識対象文字
の標準パターンや未検出の部分パターンに関する探索指
定情報を記憶する辞書およびプログラム用のメモリであ
り、RAM6は入力文字の4方向ストロークや8方向変
換データの記憶用およびプログラム実行時のワークエリ
ア用のメモリである。RAM6の記憶内容は第2図に示
すストローク抽出後のイメージに対応して格納されてお
り、その具体的な内容は第3図に示してある。
第3図中、TERMは文字端点情報の格納領域であり、
T1は1つの端点、SCはC方向のストロークを、S1
はそのC方向の追番を夫々示す。同様にT2は他の端点
を示しており、SDはD方向のストロークであることを
示す。またL,Rは文字端点のストロークに対する位置
を示しており、Lは端点位置がストロークの左側である
ことを、またRは同様に右側であることを夫々示す。C
HKNはストローク間の接続情報(屈折点)が格納され
る領域であり、図示例では追番S1のC方向ストローク
のR(右側)と追番S1のD方向ストロークのL(左
側)とが屈折点K1として接続されていることを意味し
ている。CHBKは文字分岐点情報の格納領域を示し、
図示例では、文字分岐点B1が追番S1のA方向ストロ
ークのL(左側)に、また文字分岐点B2が追番S1の
A方向ストロークのR(右側)に存在位置することを意
味している。ASTMはAストロークの端点の2次元座
標アドレス情報が格納される領域であり、同様にCST
M、DSTMはCストロークおよびDストロークの端点
の2次元座標アドレス情報が格納される領域である。ま
たPONTは未知文字の特徴系列(未知パターン)を求
める際の追跡過程を一時記憶する領域であり、またSC
Mは未知文字の8方向に変換された特徴系列を格納する
領域である。
第4図はROM5の記憶内容のうち、辞書部分を例示し
たものであり、図示例は文字「P」に対する辞書内容を
示している。この辞書には各文字格納領域毎に先ず未検
出の部分パターンの探索を指定する探索指定情報が、続
いて標準パターンを構成する特徴系列が、夫々格納して
ある。前記探索指定情報は、2値データ「1」「0」を
もって表わされ、データ「1」は未検出部分パターンが
存在するか否かを探索することを意味し、一方データ
「0」は、未検出部分パターンが存在するか否かを探索
しないことを意味している。
第5図は、上記実施例にかかる装置の照合処理の手順を
符号11〜21で示し、以下、辞書誘導処理により、候
補文字が「A」「P」に絞られた場合における未知文字
「A」と文字「P」の標準パターンとの照合処理につい
て説明する。
まずステップ11(以下「ST11」の如く示す)にお
いて、走査カウンタを初期化し、第2図に示すイメージ
を、RAM6上で走査する。図示例では、第16図に示
す如く、上辺左側から右方へ走査してゆくことになる。
この時各走査点毎にRAM6のASTM領域,CSTM
領域,DSTM領域のストローク端点の2次元アドレス
と走査カウンタの座標が一致するか否かが比較される
(ST12)。比較の結果両座標が一致しない限り走査
カウンタが更新され、この座標アドレス比較が繰り返さ
れる(ST12、14、15)。そして走査カウンタの
内容とRAM6の端点2次元アドレスが例えば座標
(7、3)にて一致すると、このストローク端点を仮の
起点とし、次にこのストローク端点が文字端点であるか
否かを判定する(ST13)。この仮の起点の座標
(7、3)はCSTM領域に格納されており、Cストロ
ークのストローク番号1の右側端点に該当する。ところ
がこの端点情報はTERM領域において文字端点の情報
として存在しておらず、従ってストローク端点(SC,
S1,R)は文字端点でないと判定される。これにより
ST13の判定が“NO”となって、ST14、15、
12の手順が繰返し実施される。
かくて走査カウンタの内容とRAM6の端点2次元アド
レスとは座標(3、26)にて一致するが、この座標は
CSTM領域においてCストロークのストローク番号1
の左側端点であるとして格納され、而もこのストローク
端点はTERM領域中に文字端点T1として存在してい
るから、端点(SC、S1、L)は文字端点であると判
断される。そこで文字端点マークをRAM6のSCM
領域に格納し、更にこの文字端点情報(SC、S1、
L)をPONT領域に格納する。この文字端点の検出に
よりST13が“YES”となり、つぎにST16にお
いて、前記PONT領域のストローク情報を用いて、第
8図に示す8方向データへの変換処理が実行される。図
示例のC方向ストロークで左から右へのストロークは方
向“0”に変換され、この方向データ“0”がRAM6
のSCM領域に格納される。続いてPONT領域に格納
したストロークからさらに接続情報を探すために、この
ストロークのもう一方のストローク端点情報(SC,S
1,R)にPONT領域を変更する。そしてC方向スト
ロークのストローク番号1の右側端(R)が文字端点であ
るか、あるいは屈折点を構成しているか、あるいは分岐
点を構成しているかをPONT領域のデータを参照し
て、TERM領域およびCHKN領域内およびCHBK
領域内の内容を調べてチェックする。図示例ではCHK
N領域で(SC,S1,R)を見出すことができ、ST
17の「接続情報有か」の判定が“YES”となって、
ST16へ戻り、同様に8方向変換処理が実行される。
第3図の例では、CHKN領域の屈折点K1の(SC,
S1,R)に対応するストローク端点情報は(SD,S
1,L)であるので、このストローク端点情報(SD,
S1,L)にPONT領域を変更して第8図に示す8方
向データへの変換処理を前記同様に実行すると、方向デ
ータ“2”が得られRAM6のSCM領域に格納され
る。続いてこのストロークのもう一方のストローク端点
情報(SD,S1,R)にPONT領域を変更して、S
T17で同様に接続情報を探していくと、このストロー
ク端点情報(SD,S1,R)はTERM領域に格納さ
れているので、ST17は"NO"と判定され、SCM領域
には文字端点マークが格納される。
かくしてSCM領域に方向データ“0”“2”、更には
文字端点マークが格納された段階に至り、ST11へ
戻り、再度走査カウンタを初期化して、前記文字端点の
探索手順(ST12、13、14、15)が繰り返し実
施される。なお一度8方向変換された探索済のストロー
ク情報については、その都度RAM6に格納されている
該当ストローク情報がスペースコード等に変換されて消
去される。本実施例の未知文字「A」の場合、他の文字
端点は存在しないから、ST15の判定が“YES”と
なってST18へ進む。このST18は、前記探索指定
情報が「1」か否かを判定しており、この場合、その判
定は“YES”(第4図参照)であるから、つぎにST
19において、RAM6のTERM領域、CHKN領
域、CHBK領域を参照して、未検出の部分パターン、
すなわち未追跡のストローク情報が残っているか否かを
探索する。この場合、前述のように8方向変換された探
索済のストローク情報については、その都度スペースコ
ード等に変換してあるため、容易に未追跡ストローク情
報の有無を判別できる。本実施例の場合、CHBK領域
にA方向の未追跡ストローク情報が存在しており、この
時点で未知文字は「P」でないと判定し得(ST2
0)、ST21の照合動作なくして第5図の処理手順を
完了する。
【図面の簡単な説明】
第1図はこの発明が実施されるパターン認識装置の回路
ブロック図、第2図は、パターン認識装置に入力された
パターンを4方向ストローク変換して得られたイメージ
の一例を示す図、第3図は第1図に示すパターン認識装
置のRAMの格納領域配置例を示す図、第4図は同RO
Mの辞書格納領域の一文字分のデータ配置例を示す図、
第5図は第1図に示すパターン認識装置の動作を説明す
るためのフローチャート、第6図は一般的なパターン認
識装置の概略を説明するためのフローチャート、第7図
(A)(B)は文字例「ア」を方向成分に変換した標準パター
ン例を説明するための図、第8図は文字のストロークの
方向成分を8方向に正規化する場合の方向番号を示す
図、第9図は文字例「ア」の光学的に読取った状態での
パターンを示す図、第10図は第9図の文字「ア」を細
めてストロークの骨格のみを示した図、第11図は4方
向成分を説明するための図、第12図は第10図に示す
文字「ア」を端点、方向成分、分岐点で表わす場合を説
明するための図、第13図は第7図に示す文字「ア」の
標準パターンと第10図、第12図に示す文字の照合に
よる文字認識動作を説明するための図、第14図は文字
「A」のストロークを示す図、第15図は文字「P」の
ストロークを示す図、第16図は文字の探索走査を開始
する起点辺を説明する図、第17図(1)(2)は第14図の
文字「A」の追跡ストロークおよび未追跡ストロークを
示す図、第18図(1)(2)は文字「P」の追跡ストローク
を示す図である。 1…A/D変換回路、2…画像メモリ 3…CPU、4…ストローク検出回路 5…ROM、6…RAM

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】認識対象を光学的に読み取って認識対象に
    対応するパターンを求める入力手段と、 前記入力手段で求められたパターンの特徴を抽出する特
    徴抽出手段と、 前記特徴抽出手段で抽出された特徴と類似した特徴を有
    する標準パターンの候補を取り出す候補取出手段と、 前記入力手段で求められたパターンをラスター走査しつ
    つ所定の条件を満たす部分パターンを抽出する部分パタ
    ーン抽出手段と、 各標準パターン毎に未検出の部分パターンの検出を行う
    か否かを指定する探索指定情報を記憶する探索指定情報
    記憶手段と、 前記候補取出手段で取り出された標準パターンの候補の
    中から前記入力手段で求められたパターンに該当するも
    のを判別するパターン判別手段とを備えており、 前記パターン判別手段は、 前記候補取出手段で取り出された標準パターンの候補に
    ついての探索指定情報が未検出の部分パターンの検出を
    行わないことを指定している場合には、前記部分パター
    ン抽出手段で抽出された部分パターンと前記標準パター
    ンとを照合することにより、標準パターンの候補の中か
    ら入力パターンに該当するものを判別し、 前記候補取出手段で取り出された標準パターンの候補に
    ついての探索指定情報が未検出の部分パターンの検出を
    行うことを指定している場合には、前記部分パターン抽
    出手段で抽出されない部分パターンの有無により、前記
    標準パターンの候補の中から入力パターンに該当するも
    のを判別するパターン認識装置。
JP59146382A 1984-07-13 1984-07-13 パターン認識装置 Expired - Lifetime JPH067394B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59146382A JPH067394B2 (ja) 1984-07-13 1984-07-13 パターン認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59146382A JPH067394B2 (ja) 1984-07-13 1984-07-13 パターン認識装置

Publications (2)

Publication Number Publication Date
JPS6125284A JPS6125284A (ja) 1986-02-04
JPH067394B2 true JPH067394B2 (ja) 1994-01-26

Family

ID=15406438

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59146382A Expired - Lifetime JPH067394B2 (ja) 1984-07-13 1984-07-13 パターン認識装置

Country Status (1)

Country Link
JP (1) JPH067394B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4906324B2 (ja) * 2005-11-25 2012-03-28 三輪精機株式会社 キャブ下降防止装置
JP5466418B2 (ja) * 2009-03-27 2014-04-09 株式会社成基総研 判定装置、判定方法、およびプログラム
JP2019205111A (ja) 2018-05-25 2019-11-28 セイコーエプソン株式会社 画像処理装置、ロボット、及び、ロボットシステム

Also Published As

Publication number Publication date
JPS6125284A (ja) 1986-02-04

Similar Documents

Publication Publication Date Title
AU706080B2 (en) Character recognition system identification of scanned and real time handwritten characters
US4972499A (en) Pattern recognition apparatus
EP0355748A2 (en) A pattern recognition apparatus and method for doing the same
JPS60217477A (ja) 手書き文字認識装置
JPH067394B2 (ja) パターン認識装置
JPH067392B2 (ja) 文字認識装置
JPH0256709B2 (ja)
KR100473660B1 (ko) 단어인식방법
JPS60164882A (ja) 文字認識装置
JPH067393B2 (ja) 文字認識装置
JPS60204088A (ja) 文字認識装置
JPS5933584A (ja) 文字認識装置
JP2851865B2 (ja) 文字認識装置
JP3151866B2 (ja) 英文字認識方法
JPH04280394A (ja) 文字認識装置及び認識文字確定方法
JP2622004B2 (ja) 文字認識装置
KR100206827B1 (ko) 문자 인식을 위한 한글/영문 판별방법
JP2578767B2 (ja) 画像処理方法
JP3138665B2 (ja) 手書き文字認識方式および記録媒体
JPS61121184A (ja) 文字認識装置
JPH02217981A (ja) オンライン手書文字認識装置
JPS5854432B2 (ja) パタ−ン認識処理方法
JPH06195508A (ja) 文字切り出し方法
JPS60217479A (ja) 文字認識装置
JPH04216171A (ja) 輪郭ベクトルの抽出方法