JPS61136180A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPS61136180A
JPS61136180A JP59258833A JP25883384A JPS61136180A JP S61136180 A JPS61136180 A JP S61136180A JP 59258833 A JP59258833 A JP 59258833A JP 25883384 A JP25883384 A JP 25883384A JP S61136180 A JPS61136180 A JP S61136180A
Authority
JP
Japan
Prior art keywords
dictionary
standard pattern
count
character
standard
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59258833A
Other languages
English (en)
Inventor
Minoru Nagao
永尾 実
Teruaki Inoue
井上 暉朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Omron Corp
Original Assignee
Omron Tateisi Electronics Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Omron Tateisi Electronics Co filed Critical Omron Tateisi Electronics Co
Priority to JP59258833A priority Critical patent/JPS61136180A/ja
Publication of JPS61136180A publication Critical patent/JPS61136180A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〈発明の技術分野〉 この発明は、未知の文字や記号、図形等(以下、「未知
文字」と総称する)を光学的方法などによって読取り、
この未知文字の幾何学的特徴を抽出した後、辞書手段中
に記憶されている複数の標準パターンとこの特徴とを照
合することによって、未知文字を特定して認識する文字
認識装置に関する。
〈発明の概要〉 この発明の文字認識装置においては、辞書手段中に標準
パターンのそれぞれに対応したカウンタ手段を設け、こ
のカウンタ手段のカウント量を、その標準パターンに対
応する未知文字が認識されたときにたとえば1ずつイン
クリメントさせて、その標準パターンが引用される頻度
の指標とするとともに、カウント量の大小に応じて辞書
手段中の標準パターンの配列を変更するように構成した
ものであり、これによって、引用頻度の高い標準パター
ンをより早く照合し、もって文字認識処理の高速化をは
かつている。
〈発明の背景〉 従来の文字認識装置では、第6図に示すように、紙面P
上に記録された未知文字を、たとえば光学的な読取りヘ
ッド1によって読取り、その光学信号をA/D変換器2
によってデジタル的な電気信号に変換するとともに白黒
2値化して、そのパターンを画像メモリ3にいったん格
納する。次に、前処理回路4によって、このパターンの
平滑化、ノイズ除去、細線化処理などのいわゆる前処理
を行なって、後の特徴抽出処理の高精度化・容易化を図
る。その後、特徴抽出回路5が、前処理後のパターンか
ら、文字認識に必要な未知文字の幾何学的特徴、たとえ
ば交点、分岐点、ループ等の有無や数を検出・抽出する
。辞書照合回路6は、抽出された文字特徴と、辞書7中
に所定の順序で記憶されている各文字についての標準パ
ターンを順次照合し、その一致度によって未知文字を特
定し、その結果出力をたとえば表示手段(図示せず)へ
送出する。
ところで前記辞書照合回路6における照合処理は、未知
文字特徴を各標準パターンと順次比較することによって
行なうが、この場合、辞書7内における全ての標準パタ
ーンにつきその配列順序に従って逐次照合を実施する場
合には、照合に要する時間が著しく長くなり、その結果
、文字認識の処理速度を極度に低下させる。そこで現在
の文字認識装置においては、第7図に示すようにまずル
ープの有無や文字連結数などの大まかな特徴のみをとら
え、これら特徴に応じてあらかじめグループ分けされた
候補文字群のひとつに大分類する。その後特徴の細部を
順次取り込んで、文字交点や分岐等による中分類、さら
に詳しい特徴についての小分類、詳細分類を行ない、候
補文字を順次絞り込んで、単数あるいは複数の候補文字
を得る。そしてこれらの候補文字のみについて詳細な照
合判定を行ない。
その一致度に応じて未知文字の認識を行なうようにして
いる。
第8図は、この絞り込み処理の詳細を示しており、ステ
ップ11で大まかな特徴がA1 r A2 +・・・・
・・r Anのいずれのグループに属するかによって大
分類され、たとえばA、で示す特徴に該当するときには
ステップ】2に進む。ステップ12では中分類が行なわ
れて、B1 + ”2 +・・・・・・、 Bnのいず
れの特徴に属するかが判断され、以下同様に、小分類の
ステップ13、詳細分類のステップ14へ移行する。詳
細分類のステップ14が実行されると、その詳細分類に
属する候補文字のみについて照合判定が行なわれる。な
お第8図には、ステップ11,12,13.14で示す
流れのみを詳しく描いてあり、他の分類への流れを省略
しているが、これらについても同様である。また、各段
階の分類において未知文字の特徴に対応する下位グルー
プが存在しない場合には、未知文字が標準パターン中に
準備されていないか、または誤記によって文字としての
形態をなしていない場合を意味するため、ステップ15
でリジェクト(認識不能)とし、再入力その他の処理へ
移行する。
上記方式によれば、未知文字の特徴と大きく異なった特
徴を有する標準パターンは照合対象からはずされるため
、照合速度はかなり向上する。しかしながら、分類その
ものは、文字特徴に基いたグループ分けに基づいており
、分類にあたっての判断順序は、辞書を作成した際に配
列した順序に固定されたままとなっている。このため、
使用頻度の高い分類につき必ずしも早期に判断照合され
るわけではなく、使用頻度の低い分類が照合された後に
、使用頻度の高い分類の照合が行なわれ−る場合がかな
り存在し、照合速度にしたがって文字認識速度の向上に
は一定の限界がある。特に、漢字入力の場合のように、
人力文字の種類が多い場合に、このような現象が顕著に
あられれるという欠点がある。
〈発明の目的〉 この発明は、上述の欠点を解消するだめのものであり、
照合処理時間を短縮し、それによつて文字認識処理の高
速化を実現する文字認識装置を提供することを目的とす
る。
〈発明の構成および効果〉 上記目的を達成するため、この発明の文字認識装置にお
いては、辞書手段中に標準パターンのそれぞれに対応し
てカウンタ手段を設けておき、辞書照合に際し、未知文
字の特徴と一致する標準パターンが見い出されたときに
、その標準パターンのカウンタ手段のカウント量を所定
量変化させるとともに、各カウンタ手段のカウント量を
互いに比較し、カウント量の大小に応じて辞書手段内の
標準パターンの配列順序を変更して再配列するよう構成
した。
この発明によれば、各カウンタ手段のカウント量は、対
応する標準パターンが引用される頻度の指標となってお
り、これに基づいて標準パターンの再配列が自動的に行
なわれるため、照合の順序が、より頻度の高い分類を優
先して行なわれ、照合時間の短縮、したがって文字認識
の高速化を図ることができるなどの効果を奏する。
〈実施例の説明〉 第2図はこの発明の一実施例である文字認識装置の主要
部を示す。この装置例と第6図に示した従来の装置とは
、辞書再配列回路21を新だに付加した点、辞書23内
に各標準パターンのそれぞれに対応してカウンタ手段と
してのカラ/り領域を設けた点、CPU22が後述する
制御動作をも実行するようプログラムしである点などに
おいて相違する。
このうち辞書再配列回路21と、その周辺回路の構成例
を第1図に示す。第1図において、辞書メモリ31は、
上述した辞書23の要部を形成するメモリであって、メ
モリアドレスレジスタ32は、この辞書メモリ31に対
するり−ド/ライト(R/W)動作を行なう際のアドレ
スを保持するだめのものである。この辞書メモリ   
 。
31における記憶領域の配列を第3図に示しており、図
示例の場合、標准パターンの文字特徴データを記憶させ
る領域と、後記するカウント量を記憶させるカウンタ領
域とが対をなして所定の順序で配列されている。この配
列順序は辞書作成時に決定されるもので、同様の配列が
前記大分類、中分類、小分類、詳細分類のそれぞれに対
応して設定されている。
つぎにバッファレジスタ34.36は、辞書メモリ31
中の積電パターンの文字特徴に関するデータをそれぞれ
ロードして一時保持するレジスタであり、更に他のバッ
ファレジスタ33゜35は、上記バッファレジスタ34
.36にバッファされる標準パターンにそれぞれ対応し
たカウンタ領域の内容すなわちカウント量をそれぞれ保
持するだめのものである。メモリR/wコントロール回
路37は、前記メモリアドレスレジスタ32を用いて辞
書メモリ31に対するリード/ライト動作を行なう際の
タイミングを制御する。まだ大小比較回路38は、バッ
ファレジスタ33.35にバッファされているそれぞれ
の量すなわちカウント量を互いに比較し、その大小関係
に応じた出力を発生する回路である。更に一致検出回路
39は、バッファレジスタ34内にバッファされている
文字特徴データと、特徴抽出回路5(第2図)から入力
される未知文字の文字特徴を表わすデータとの一致・不
一致を検出し、その検出出力を、ゲート回路40および
バッファレジスタ33へ与える。この検出出力は、一致
のときにのみ能動化されるように構成されており、これ
によってバッファレジスタ33中のカウント量が1だけ
インクリメントされるとともに、ゲート回路40のゲー
トが開くようになっている。そして、このゲート回路4
0のゲートが開くと、大小比較回路38からの比較出力
は、メモリR/Wコントロール回路37に出力されると
ともに、CPU22に対して割込み処理を要求し、それ
によって、後述する辞書メモリ31中の再配列等を行な
わせる。
次に、これらの図を参照して、この実施例の動作を説明
する。まず、第2図の読取りヘッド1によって読取られ
た未知文字のパターンは、第6図で説明したと同様の順
序で、A/D変換、白黒2値化、前処理および特徴抽出
の各処理を受けた後、抽出された文字特徴につき、第7
図で説明した大分類処理が行なわれる。この場合まず、
辞書メモリ31に格納されている大分類用の標準パター
ンデータのうち、先頭に位置するものつまり優先順序が
最も高いものをバッファレジスタ34ヘロードし、また
その標準パターンに対応するカウンタ領域に格納されて
いるカウント量をバッファレジスタ33ヘロードする。
他のバッファレジスタ35.36はこれに先立って0に
クリアしておくものとし、また辞書メモリ31内のカウ
ンタ領域も初期には0となっているものとすると;この
時点では、バッファレジスタ33,35.36の内容は
すべて0となっている。
次K、バッファレジスタ33.35のそれぞれのカウン
ト量を大小比較回路38によって比較するとともに、バ
ッファレジスタ34内の標準パターンの特徴と久方文字
の特徴との一致性を、−数構出回路39によって検出す
る。もし一致すると判断されたときには、−数構出回路
39からの出力が能動化されて、バッファレジスタ33
内のカウント量が1だけインクリメントされるとともに
、ゲート回路40のゲートが開かれる。ところが、大小
比較回路38を、バッファレジスタ33のカウント量が
バッファレジスタ35のカウント量よりも大きいときに
のみその出力が能動化されるように構成しておくものと
すると、この例の場合にはバッファレジスタ33.35
のそれぞれのカウント量はともにOであって相等しい(
大小比較回路38の比較動作は、上記インクリメント動
作の前に行なわれている。)ため、その出力は非能動状
態であって、再配列の要求は生じないこと洸なる。
このため、CPU22は、バッファレジスタ33のイン
クリメント後の内容と、バッファレジスタ34内の標準
パターンデータとを、辞書メモリ31内の元のアドレス
に再格納する。一方特徴の一致が見い出されなかったと
きには、−数構出回路39の出力は非能動状態であって
、上記インクリメントと再配列とはいずれも生じない。
先頭の標準パターンとの照合が完了し、次の標準パター
ンとの照合を行なうときには、バッファレジスタ33.
34の内容をそれぞれバッファレジスタ35.36へと
転送し、辞書メモリ31中で次の順位となっている標準
パターンの文字特徴データをバッファレジスタ34に、
そのカウント量をバッファレジスタ33に、それぞれロ
ードする。その後、前記と同様の一致模出と大小比較と
が行なわれるが、ここでは、バッファレジスタ34に入
っている標準ツマターンと入力文字特徴とが一致し、か
つバッファレジスタ33のカウント量がバッファレジス
タ35のカウント量よりも大きい場合を規定する。すな
わち、現時点においてはより低い優先順位を有するバッ
ファレジスタ34の標準パターンがバッファレジスタ3
6の標準パターンよりもより大きな使用(引用)頻度を
有しているということが、過去の文字認識の結果として
のカウント量に表われている場合である。このときには
、−数構出によって、バッファレジスタ33のカウント
量が1だけインクリメントされるとともに、大小比較回
路38の出力が能動状態となり、ゲート回路40を介し
てメモリR/wコントロール回路37とCPU22とに
対し再配列要求を行なう。これによ!;l CPU22
は、メモリアドレスレジスタ32のアドレスのセントと
、メモリR/Wコントロール回路37の帯込みタイミン
グコントロール出力のセントとを通して、バッファレジ
スタ33.34の内容とバッファレジスタ35.36の
内容とを、ロード時とは逆の順序となるように辞書メモ
リ31内に格納し、これらの2つの標準パターンの順序
を変更して再配列を行なう。
このようにして大分類処理と、それに並行して実行され
る再配列処理とを完了すると、中分類、小分類、詳細分
類へと順次移行するが、これらにおいても同様の再配列
処理を並行して行なう。着た、詳細分類によって候補文
字が絞り込まれた後の、複数の候補文字にわたる照合判
定においても、同様の再配列を行なわせることができる
。この例では、1回の分類判断に際して、2つの標章パ
ターンの間の順序の変更を行なっているが、このような
再配列を重ねて行くことによって、より大きな使用(引
用)頻度を有する標準パターンが、より高い優先順位と
なるような再配列が実現できることになる。
このようにして再配列が行なわれた標準パターンの配列
例を第4図に示す。第4図(a)は、辞書メモリ31内
の初期の配列であり、ア、つ、ス、・・・・・・のそれ
ぞれの標章パターンについて、カウント量はすべてOと
なっているが、第5図のような未知文字を認識して行く
につれてこれらは再配列され、第4図(b)のような配
列となる。
なお「ア」についての重複があるのは、各文字ごとに複
数の標章パターン(サブカテゴリ)があるためである。
したがって、この例のように、「ス」が頻出するような
文字入力の場合には、「ス」の標章パターンが配列の先
頭に移動させられ、その後の照合の平均時間が短かいも
のとなってくる。
なお、上記実施例では、分類を用いた照合を想定してい
るが、入力文字の種類が少ないなどの状況下で順次照合
を行なう場合においては、分類されていない積重パター
ンについての再配列を行なうこともできる。また、カウ
ンタ手段としてダウンカウンタ型のカウンタ領域を設け
、−数構出があるごとにデクリメントして、カウント量
が小さい順に再配列する。などの変形も、もちろん可能
である。
【図面の簡単な説明】
第1図は辞書再配列回路とその周辺回路を示すブロック
図、第2図はこの発明の一実施例の要部を示すブロック
図、第3図は標應パターンデータ領域とカウンタ領域と
の配列例を示す図、第4図は実施例における再配列例を
示す図、第5図は入力文字の例を示す図、第6図は従来
の文字認識装置を示すブロック図、第7図は分類照合を
示すフローチャート、第8図は分類照合の詳細を示すフ
ローチャートである。 5・・・・・・特徴抽出回路 6・・・・・・辞書照合
回路21・・・・・・辞書再配列回路 31・・・・・
・辞書メモリ33〜36・・・・・・バンファレジスタ
38・・・・・・大小比較回路 39・・・・・・−数
構出回路特許出願人  立石電機株式会社 −+  / =;a     苦辛11こiり困J斉と
での周し乙を示すフーロノクロ+F2図

Claims (1)

  1. 【特許請求の範囲】 未知文字パターンの幾何学的特徴を抽出し、辞書手段中
    に記憶された標準パターンと前記幾何学的特徴とを順次
    照合し、その照合結果に基いて前記未知文字を認識する
    装置であつて、 前記辞書手段中に各標準パターンのそれぞ れに対応して設けられたカウンタ手段と、前記照合によ
    つて未知文字パターンの幾何学的特徴が一致する標準パ
    ターンが見い出されたときその標準パターンに対応する
    カウンタ手段のカウント量を所定量変化させるカウント
    量変化手段と、 前記各カウンタ手段のカウント量を互いに 比較しカウント量の大小に応じて前記辞書手段中におけ
    る各標準パターンの配列順序を変更して再配列する辞書
    再配列手段とを具備して成る文字認識装置。
JP59258833A 1984-12-06 1984-12-06 文字認識装置 Pending JPS61136180A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59258833A JPS61136180A (ja) 1984-12-06 1984-12-06 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59258833A JPS61136180A (ja) 1984-12-06 1984-12-06 文字認識装置

Publications (1)

Publication Number Publication Date
JPS61136180A true JPS61136180A (ja) 1986-06-24

Family

ID=17325657

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59258833A Pending JPS61136180A (ja) 1984-12-06 1984-12-06 文字認識装置

Country Status (1)

Country Link
JP (1) JPS61136180A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007255317A (ja) * 2006-03-23 2007-10-04 Tanaka Suiryoku Kk 水力発電用フランシス水車

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007255317A (ja) * 2006-03-23 2007-10-04 Tanaka Suiryoku Kk 水力発電用フランシス水車

Similar Documents

Publication Publication Date Title
JP2607457B2 (ja) パターン認識装置
CN102982349B (zh) 一种图像识别方法及装置
CN109284757A (zh) 一种车牌识别方法、装置、计算机装置及计算机可读存储介质
CN107608968A (zh) 面向文本大数据的中文分词方法、装置
CN111695453A (zh) 绘本识别方法、装置及机器人
US3942169A (en) Pattern recognition system
EP0032913A1 (en) MULTIFONT CHARACTER RECOGNITION TECHNOLOGY.
JPS61136180A (ja) 文字認識装置
CN114611147A (zh) 一种姓名字段脱敏处理方法、系统、装置及存储介质
JPS61136181A (ja) 文字認識装置用辞書作成方法
JP2556477B2 (ja) パタン照合装置
JPS61136179A (ja) 文字認識装置
JPH024033B2 (ja)
JPH0223906B2 (ja)
JP2774113B2 (ja) 文字認識方法
JP2746345B2 (ja) 文字認識の後処理方法
JP3121401B2 (ja) 認識辞書及び文字認識装置
JP2712186B2 (ja) 文字認識装置
JP2917396B2 (ja) 文字認識方式
JPH048816B2 (ja)
JPS6089290A (ja) パタ−ン認識方法
JPH03268054A (ja) 高速並列処理システム
JPS5999586A (ja) 光学的文字読取装置
JPS6191780A (ja) 文字認識装置
JPH02193279A (ja) ソーティング装置