JPH067393B2 - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH067393B2
JPH067393B2 JP59083518A JP8351884A JPH067393B2 JP H067393 B2 JPH067393 B2 JP H067393B2 JP 59083518 A JP59083518 A JP 59083518A JP 8351884 A JP8351884 A JP 8351884A JP H067393 B2 JPH067393 B2 JP H067393B2
Authority
JP
Japan
Prior art keywords
character
stroke
end point
dictionary
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP59083518A
Other languages
English (en)
Other versions
JPS60225984A (ja
Inventor
実 永尾
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Tateisi Electronics Co filed Critical Omron Tateisi Electronics Co
Priority to JP59083518A priority Critical patent/JPH067393B2/ja
Publication of JPS60225984A publication Critical patent/JPS60225984A/ja
Publication of JPH067393B2 publication Critical patent/JPH067393B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Description

【発明の詳細な説明】 <発明の技術分野> 本発明は、未知のカナ、英字、数字等の文字を自動的に
読取って認識する文字認識装置に関する。
<発明の背景> 従来この種の文字認識装置では、第1図に示す如く、用
紙P上に未知文字を読取装置1で読み取り、読取出力を
A/D変換器2でデジタル信号に変換し、これを前処理
回路3にてさらに“1”,“0”の2値パターンに変換
している。またこの前処理回路3では、上記2値パター
ンにつき後の処理を効果的にするための前処理、すなわ
ち文字が記録されている用紙P上の黒点などのノイズ処
理や文字図形境界面の平滑化などを含む一連の処理がな
される。次に特徴抽出回路4において、文字認識を行な
うのに必要ないくつかの特徴(交点、分岐点、ループ
数、ストロークの長さ情報など)を抽出する特徴抽出処
理が行なわれる。そしてこの抽出結果に応じて、つぎの
辞書照合回路5では、多数の文字より特徴が共通する文
字のいくつかが候補文字として絞り込まれる。この絞り
込みにより第1段階の認識が終了するが、候補文字が複
数ある場合にはさらにその中から唯一の文字の選択を行
なうための詳細な識別処理がなされる。この詳細な識別
処理は一般には辞書照合処理といわれる。ここで辞書6
とは各文字の特徴を一定の系列で格納したもので通常R
OMで構成されている。それゆえ上述した候補文字の絞
り込みは、特徴抽出によって得られた特徴群に基づき、
辞書の中から特定の文字群を選定することをいい、辞書
誘導処理と呼ばれる。
上述したようにこの辞書誘道処理に続いて、辞書6中に
予め記憶される各文字の標準となる特徴系列(以下、標
準パターンという)と認識対象文字の対応する特徴系列
の一致度を検出する照合処理がなされる。この照合処理
結果に基づき読取った文字が特定されたり、或いは認識
不能として認識結果が出力される。
次に、辞書の一例について説明する。
第2図(A)は,同図(B)のカナ文字「ア」の標準パターン
D1を図形化したものであり、ここに示した標準パター
ンD1が辞書として記憶されている。すなわちこの辞書
において文字「ア」は、3つの端点と、1個の分岐点
と、番号値であらわされる10個の方向成分(ベクト
ル)とで構成されている。なおここに示すベクトル番号
値は文字のストローク方向がそれぞれ第3図に示す0か
ら7までの8方向のいずれの方向であるか区別するため
のものである。したがって、上記標準パターンD1は文
字「ア」が端点から始まって2・1・2・3・4・5
というベクトルをこの順番で有した後、分岐点で終了
する要素と、端点から始まりベクトル2・3・4・5
および端点をこの順番で有する要素とを含むことを示
している。これらの各要素を図示したものが第2図(B)
の下段に示すものである。
次に照合処理の一例について説明する。
第4図に示す照合例では、入力された未知文字「ア」
(第5図に示す)の持つベクトル番号値と、辞書「ア」
の標準パターンが持つベクトル番号値とを比較してい
る。この例では未知文字「ア」のベクトル番号値が標準
パターンのベクトル番号値に全て含まれ且つ順番も一致
しているから、入力された未知文字はカナ文字「ア」と
認識される。このことから照合処理、殊に複数の候補文
字が絞り込まれた場合の照合処理では文字を構成するベ
クトル番号値の順番が重要となることが理解できる。
ところで、絞り込まれた複数の候補文字から唯一の文字
を選択する照合処理では、第6図(A)(B)に示す如く、例
えば絞り込まれた候補文字が「ラ」と「ヲ」であるとす
ると、「ラ」を構成する要素の前半部(特徴系列D2
は1であり、一方「ヲ」を構成する要素の前半部
(特徴系列D3)は14である。従ってこの両者は
不一致であるから、これらの文字が異なる文字であると
識別し得、必ずしも全ストロークについて照合する必要
はない。
ところが、従来の照合方式では、斯る場合においても未
知文字の全ストロークをベクトル変換し、この全ベクト
ル番号値を辞書の標準パターンと照合することが行なわ
れる結果、ストロークのベクトル変換処理に余分な時間
がかかる許りでなく照合処理に長時間を必要とする等、
の欠点があった。
<発明の目的> 本発明は絞り込まれた候補文字の特定ストロークのみを
ベクトル変換することによって、ベクトル変換処理の簡
略化と照合処理時間の短縮化を図った文字認識装置を提
供することを目的とする。」 <発明の構成および効果> 上記目的を達成するため、本発明では標準パターンを格
納する辞書記憶手段に、各文字毎に探索時のストローク
端点位置情報と、探索回数の指定情報とを記憶させ、辞
書照合手段により、ストローク端点位置情報と探索の回
数情報とに基づき未知パターンの特徴を探索しつつ標準
パターンと比較するようにした。
本発明によれば辞書照合処理等、最少数のストロークを
ベクトル変換し、このベクトル列の一致度を判定するこ
とによって唯一の候補文字を特定できる。これにより、
本発明ではストロークのベクトル変換処理や照合処理が
簡略化されるのみならず、必要なストロークについての
特徴系列のみを辞書パターンとして用意するだけでよ
く、照合処理時間の短縮、辞書メモリ容量の節減を実現
する等、発明目的を達成した効果を奏する。
<実施例の説明> 第8図は、本発明にかかる文字認識装置を示し、用紙P
上の文字はA/D変換器7で光学的に読取られデジタル
データに変換されて画像メモリ8に記憶される。A/D
変換器7にはCPU9およびストローク検出回路10が接
続されており、CPU9は照合処理を含む文字認識装置
をプログラムにしたがい実行し、またストローク検出回
路10は読取られた文字を例えば第9図に示すA〜Dの
4方向ストローク(第11図参照)に変換する。また図
中、ROM11は認識対象文字の標準パターンを記憶す
る辞書および文字認識処理プログラム格納用のメモリで
あり、RAM12は、入力文字の4方向ストロークや8
方向変換データの記憶用およびプログラム実行時のワー
クエリヤ用のメモリである。RAM12の記憶内容は、
第9図に示すストローク抽出後のイメージに対応して格
納されており、その具体的な内容は第10図に示してあ
る。
第10図中、TERMは文字図形の端点情報の格納領域
であり、T1は1つの端点、SAはA方向のストローク
を、S1はそのA方向の追番を夫々示す。同様にT2〜
T4は他の端点を示しており、SCはC方向のストロー
クであることを、また、SBはB方向のストロークであ
ることを示す。更に、L,R,U,Dは文字端点のスト
ロークに対する位置を示しており、Lは端点位置がスト
ロークの左側であることを、またRは同様に右側である
ことを示し、U,DはBストロークの場合に適用され、
Uは上側、Dは下側であることを示している。CHKN
は、ストローク間の接続情報(屈折点)が格納される領
域であり、図示例ではK1は追番S1のA方向ストロー
クのR(右側)と追番S1のB方向ストロークのU(上
側)とが屈折点として接続されていることを意味し、ま
たK2は追番S1のB方向ストロークのD(下側)と追
番S1のCストロークのR(右側)とが屈折点として接
続されていることを、意味している。ASTMはAスト
ロークの端点の2次元座標アドレス情報が格納される領
域であり、BSTMはBストロークの端点の2次元座標
アドレス情報が格納される領域であり、同様にCSTM
はCストロークの端点の2次元座標アドレス情報が格納
される領域である。
なお、ストロークの端点の2次元座標アドレス情報を格
納する領域としては、Dストロークの端点アドレス情報
を格納する領域DSTMも設けられるが、ここでは第9
図の文字例にDストロークを含んでいないので図示され
ていない。また、PONTは未知パターンのストローク
追跡過程におけるストローク情報を格納する領域、SC
Mは認識対象文字すなわち未知文字のストロークの8方
向に変換されたデータを格納する領域、SCONTは後
記のストローク追跡の回数指定情報を格納する領域であ
る。
第12図は、ROM11の記憶内容のうち、辞書部分を
例示したものであり、図示例は第13図のカナ文字
「ラ」を示している。この辞書には各文字格納領域毎
に、ストローク追跡の回数指定情報、ストロークの端点
位置情報、および標準パターンの特徴系列がそれぞれ格
納されている。図中、ALは第15図に示す如くカナ文
字「ヲ」を上側から走査するとき最初に出会うストロー
ク端点位置がA方向のストロークの左側であり、この文
字端点からストローク追跡を開始することを意味する。
同様に、それがA方向ストロークの右側であるときは
「AR」と指定され、また、B方向ストロークの上側、
下側のときは「BU」、「BD」、C方向ストロークの
左側、右側のときは「CL」「CR」、およびD方向の
ストロークの左側、右側のときは「DL」「DR」、と
して指定される。
第14図は、上記実施例にかかる装置の照合処理動作を
示し、以下、辞書誘導処理により絞られた候補文字
「ヲ」,「ラ」のうち、候補文字「ヲ」と辞書「ラ」と
の照合処理について説明する。先ず、第7図に基づいて
基本説明を行う。第7図(A)(B)に示す照合処理例におい
て、カナ文字「ラ」の辞書にはT010Tの特徴系列が
格納されており、これと、未知文字「ヲ」のストローク
P2にかかる特徴系列(T14T)とを照合すると、こ
の両者は不一致であり、従って、未知文字はカナ文字
「ラ」でないと判定される(第7図(A)参照)。一方、
前記「ラ」の辞書と未知文字「ラ」のストロークP3に
かかる特徴系列(T1T)とを照合すると両者は一致
し、従って未知文字はカナ文字「ラ」であると判定され
る(第7図(B)参照)。
実施例では、第8図および第9図に示すように入力され
た文字は「ヲ」の場合であり、上記辞書誘導処理により
絞り込まれた候補文字は「ラ」,「ヲ」の2文字であ
る。そこで第14図では入力文字「ヲ」をROM11内
の「ラ」の辞書(第12図参照)と照合するための処理
動作を説明する。
先ず、ステップ21(以下、「ST21」の如く示す)
において、ROM11の「ラ」の辞書(第12図)を参
照し、走査回数1をSCONT領域にロードする。つぎ
に、ST22で同様にROM11の辞書を参照し、第1
回目走査のストローク端点位置情報ALをロードした
後、上側辺の左端に相当するアドレスを走査カウンタに
格納して初期化する(ST23)。次に走査モードにし
たがって第15図に示したイメージをRAM12上で走
査する。図示例では、第15図に示す如く、上側辺左側
から右端に走査してゆくことになる。この時、各走査点
毎にRAM12のASTM領域、BSTM領域、CST
M領域のストローク端点の2次元アドレスと走査カウン
タの座標が一致するか比較される(ST24)。比較の
結果、両座標が一致しない限り走査カウンタが更新され
この座標アドレス比較が繰り返される(ST24、ST
28、ST29)。そして、走査カウンタの内容とRA
M12の端点2次元アドレスが例えば座標(3,3)に
て一致すると、このストローク端点を仮の起点とし、次
にこのストローク端点が文字端点であるか否かを判定す
る(ST25)。この座標(3,3)はASTM領域に
格納されており、A方向ストロークのストローク番号1
の左側端点に該当する。更に、この端点情報はTERM
領域において、文字端点T1の情報として存在してい
る。そこで、ST25は“YES”と判定され、このス
トローク端点を文字端点とし、前記走査時の仮の起点と
してPONT領域にこの情報(SA,S1,L)を格納
する。
つぎに、ST26でこの文字端点を前記辞書よりロード
したストローク端点位置情報と比較し、ストロークの種
類および端点位置が一致するか否かを判定する。本実施
例の場合、辞書よりロードした情報はAストロークの左
側端点を意味するALであるから、この両者は一致し、
したがって、この文字端点を走査時に起点とし、文字端
点マークをRAM12のSCM領域に格納する。
ところで、第9図における文字接続点(屈折点)K1
仮に文字端点であると仮定し、上記のようにこの接続点
(端点とする)が仮りの起点となったとき、これはA方
向ストロークの右側端点に相当し、この場合、辞書より
ロードしたストローク端点位置情報と不一致となる。こ
の場合にはST26の判定が“NO”ST27の判定が
“YES”となり、走査カウンタはその内容が端点T1
のY座標アドレスに達するまで更新が繰り返されること
になる。
尚、ST27の判定が“NO”の場合は、全く目的外の
文字端点が抽出されたものとして処理を終了し、照合不
一致としてリジェクト処理される。
他方ST24において一致判定を得た座標データが文字
端点格納領域TERM中に発見されない場合には、これ
は検出された座標が文字端点ではないことを示すからS
T25の判定が“NO”となり、走査カウンタを更新す
べく制御はST28に移される。
次に文字端点であることが検出された場合には前記PO
NT領域のストローク情報を用いて、第3図に示す8方
向データ(A方向ストロークで左から右へのストローク
は方向1)に変換し、この方向データ“1”をRAM1
2の8方向変換データ格納領域SCMに格納する(ST
30)。
続いてPONT領域に格納したストロークからさらに接
続情報を探すために、このストロークのもう一方のスト
ローク端点情報(SA,S1,R)にPONT領域を変
更する。そして検出されたA方向ストロークのストロー
ク番号1の右側端(R)が文字端点であるか、あるいは接
続点を構成しているかをPONT領域のデータを参照し
て、文字端点格納領域TERMおよび接続点格納領域C
HKN内の登録内容を調べてチェックする。
図示例では、変更後のストローク端点(SA,S1,
R)がストロークBの上側端点(SB,S1,U)と接
続していることがCHKN領域のデータでわかる。従っ
て、接続情報の有無をチェックするST31の判定が
“YES”となり、PONT領域のストローク情報を
(SB,S1,U)に変更した後、制御はST30へ移
され、以後、文字端点が検出されるまでST30、ST
31が繰り返し実行される。その結果、図示例では1
34がRAM12のSCM領域に格納される。
尚、上記の動作において8方向変換の終了したストロー
クはRAM12のデータの適宜の場所において、抹消
(ストロークのベクトル番号値をスペースコードに変
換)処理され、同一ストロークの重複検出が防止され
る。
次に、文字端点が検出され「接続情報の有無」をチェッ
クするST31の判定が“NO”となると、ST32に
おいてSCONT領域にロードされた走査回数から
「1」減算される。実施例の場合、ロードされた走査回
数が1であったからSCONT領域は0になる。従って
つぎのST33の「SCONT=0」の判定は“YE
S”となってST34へ移行し、RAM12上の8方向
変換データ格納領域(SCM)の内容とROM11の辞
書「ラ」の標準パターンとが比較される。実施例の場合
は、SCMの内容が「134」であり、比較される
ROM11の辞書「ラ」の標準パターンは第12図に示
すごとく、「01」であるため、不一致として判定
される。
尚、ST33の判定が“NO”の場合はロードされた回
数の走査が実行されていないことを意味するから、次の
ストロークを走査するためST35へ移行し、つぎのス
トローク端点情報をROM11の辞書からロードした
後、ST23へ戻り前記動作をSCONT領域の内容が
「0」になるまで実行する。第16図は、ROM11に
おけるカナ文字「ヲ」の辞書のデータ配置例を示す。こ
のデータを第12図のカナ文字「ラ」の辞書と比較する
と、走査回数および端点位置情報については両者が一致
するが、標準パターンの特徴系列については、「ラ」の
標準パターンが「010」であるのに対し、「ヲ」
では「01345」である。
したがって、前記第9図に示す入力文字とこの「ヲ」の
辞書とを第14図の手順で照合すると、RAM12内の
SCMには「ラ」の辞書との照合時と同様、「134
」が格納される。このパターンは上記した「ヲ」の標
準パターンと一致するものとみなされるので、入力文字
は「ヲ」であると判断される。
【図面の簡単な説明】
第1図は一般的な文字認識装置の全体構成を示すブロッ
ク図、第2図(A),(B)は文字例「ア」を方向成分に変換
した標準パターン例を説明するための図、第3図は文字
のストロークの方向成分を8方向に正規化する場合の方
向番号を示す図、第4図は第2図に示す文字「ア」の標
準パターンと第5図に示す文字との照合結果を説明する
ための図、第5図は文字「ア」をストロークの骨格のみ
で示した図、第6図(A),(B)は未知文字「ラ」「ヲ」の
特徴系列を説明するための図、第7図(A),(B)は辞書
「ラ」と未知文字「ラ」,「ヲ」との照合処理例を説明
するための図、第8図はこの発明が実施される文字認識
装置の回路ブロック図、第9図は、入力された文字を4
方向ストロークに変換したイメージの一例を示す図、第
10図は第8図に示す文字認識装置のRAMの格納領域
配置例を示す図、第11図は4方向成分を説明するため
の図、第12図はROMの辞書格納領域のカナ文字
「ラ」についてのデータ配置例を示す図、第13図は文
字「ラ」の特徴系列を説明するための図、第14図は第
8図に示す文字認識装置の動作を説明するためのフロー
チャート、第15図は第9図に示す文字イメージをRA
M上で走査する動作を説明する図、第16図はROMの
辞書格納領域のカナ文字「ヲ」についてのデータ配置例
を示す図である。

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】未知文字を光学的に読み取って文字パター
    ンを求める読取手段と、文字パターンの特徴を抽出する
    特徴抽出手段と、抽出された特徴を記憶する特徴記憶手
    段と、抽出された文字特徴を共通にする文字グループを
    認識候補文字として絞り込む辞書誘導手段と、各文字毎
    に固有の標準パターンを記憶すると共に探索時のストロ
    ークの端点位置情報および探索回数の指定情報を予め規
    定して記憶する辞書記憶手段と、前記誘導された文字グ
    ループの各文字についてストロークの端点位置情報およ
    び探索の回数情報に基づき、未知パターンの特徴を探索
    しつつ標準パターンと比較する辞書照合手段とを具備し
    て成る文字認識装置。
JP59083518A 1984-04-24 1984-04-24 文字認識装置 Expired - Lifetime JPH067393B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59083518A JPH067393B2 (ja) 1984-04-24 1984-04-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59083518A JPH067393B2 (ja) 1984-04-24 1984-04-24 文字認識装置

Publications (2)

Publication Number Publication Date
JPS60225984A JPS60225984A (ja) 1985-11-11
JPH067393B2 true JPH067393B2 (ja) 1994-01-26

Family

ID=13804702

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59083518A Expired - Lifetime JPH067393B2 (ja) 1984-04-24 1984-04-24 文字認識装置

Country Status (1)

Country Link
JP (1) JPH067393B2 (ja)

Also Published As

Publication number Publication date
JPS60225984A (ja) 1985-11-11

Similar Documents

Publication Publication Date Title
US5287275A (en) Image recognition apparatus and method for recognizing a pattern within an image
EP0163377A1 (en) Pattern recognition system
US5621818A (en) Document recognition apparatus
US5010579A (en) Hand-written, on-line character recognition apparatus and method
JPH0682403B2 (ja) 光学式文字読取装置
JPH067393B2 (ja) 文字認識装置
JPH067394B2 (ja) パターン認識装置
JPS60204088A (ja) 文字認識装置
JPH0256709B2 (ja)
JPH067392B2 (ja) 文字認識装置
JPS60164882A (ja) 文字認識装置
JPS5933584A (ja) 文字認識装置
JP2899377B2 (ja) 文字認識装置
JP2680311B2 (ja) 文字認識方式
JP2851865B2 (ja) 文字認識装置
JPS6252912B2 (ja)
JPH07117995B2 (ja) 文字認識装置
JP2622004B2 (ja) 文字認識装置
JPH0578067B2 (ja)
JPS6115288A (ja) 光学的文字読取装置
JPH02193281A (ja) 文字認識装置
JPS60142791A (ja) 文字認識用辞書作成方法
JPH01161592A (ja) 文字認識装置
JPH0557633B2 (ja)
JPS6227883A (ja) パタ−ン認識装置