JPS63138479A

JPS63138479A - 文字認識装置

Info

Publication number: JPS63138479A
Application number: JP61285140A
Authority: JP
Inventors: Kazunori Nakao; 中尾　和則; Satsuki Nagira; 柳楽　さつき
Original assignee: Toshiba Corp; Toshiba Software Engineering Corp
Current assignee: Toshiba Corp; Toshiba Software Engineering Corp
Priority date: 1986-11-29
Filing date: 1986-11-29
Publication date: 1988-06-10

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［発明の目的］（産業上の利用分野）本発明は、複数の単語記入領域を有する８１票に記入さ
れた各単語を認識する際に用いられる文字認識装置に関
する。

（従来の技術）従来から文字認識装置の中で、認識正答率を向上させる
ために、知識辞書を用いて認識単語候補の妥当性チェッ
ク（以下知識処理と称する）を行なうものが知られてい
る。

この知識処理は、認識部で得られた認識単語候補と、意
味的に正当な単語が登録されている知識辞書とを比較し
、最終的な認識単語を選択するものである。

例えば第２図において、帳ＷＳ上の姓名記入領域Ｆ１に
記入された単語の認識を行なう場合には姓名用知識辞書
Ｊ１を用いて知識処理を行ない、企業名記入領域Ｆ２に
記入された単語の認識を行なう場合には企業名用知識辞
書Ｊ２を用いて知識処理を行なう。

しかしながら従来の文字認識装置において、帳票Ｓ上に
複数の属性をもつ領域がある場合には、複数の属性に対
応する大容量の知識辞書を予め用意しておかなければな
らない。

例えば第２図の帳票Ｓにおいて、姓名、企業名のいずれ
かが対応する姓名十企業名記入領域Ｆ３に記入された単
語の認識を行なう場合には、前記姓名用知識辞書Ｊ１と
企業名用知識辞書Ｊ２とが結合されたものに等しい姓名
十企業名用知識辞書Ｊ３を用いて知識処理を行なう。

したがって９１票上にこのような領域が多く存在する場
合には、大容量の知識辞書を幾つも用意しておかなけれ
ばならず、知識辞書を作る際に非常に手間がかかり、運
用コストが高くなるという問題があった。

（発明が解決しようとする問題点）本発明は上述したような事情によりなされたもので、帳
票上に複数の属性が対応する文字記入領域領域が多く存
在する場合でも、知識辞書を作る際の手間が少なく、運
用コストを低く抑えることができる文字認識装置の提供
を目的としている。

［発明の構成］（問題点を解決するための手段）本発明の文字認識装置は、複数の単語記入領域を有する
帳票から各単語のイメージを得る読取部と、前記単語記
入領域に記入されるべき単語の属性を記憶する属性記憶
部と、前記単語のイメージを認識し１つの単語ののイメ
ージに対応する複数の認識単語候補を得る認識部と、各
単語の属性に対応して各認識単語候補の妥当性を判断す
るための情報が格納されている複数組の知識辞書と、複
数の属性をもつ前記単語記入領域に記入されている単語
のイメージの認識単語候補と前記各属性に対応した複数
の知識辞書とを対比して最も妥当な認識単語候補を認識
単語として出力する知識処理部とを備えたものである。

（作　用）本発明の文字認識装置では、読取部が帳票から各単語の
イメージを得、認識部が前記イメージを認識し１つの単
語のイメージに対応する複数の認識単語候補を得ると、
知識処理部が複数の属性をもつ単語記入領域の認識単語
候補と前記各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は１つの属性に対応させてお
くだけでよい。

（実施例）以下、本発明の実施例の詳細を図面に基いて説明する。

第１図は本発明の一実施例の梢成を示すブロック図であ
る。

同図において１は複数の単語記入領域を有し、各領域に
記入される単語の属性が予め判明している帳票からイメ
ージを得るスキャナ部、２は１つの単語記入領域分のイ
メージを認識し、幾つかの認識単語候補（文字コードで
表わされている）を出力する認識部、３は知識処理を実
行するか否かを判断する知識処理制御部、４は各認識単
語候補の知識処理を実行するのに必要な知識辞書を選択
する知識辞書管理部、５ａ、５ｂ・・・はそれぞれ１つ
の属性に対応し、意味的に正当な単語精報（文字コード
で表わされている）が格納されている知識辞書、６は与
えられた認識１１語候補と各知識Ｒ書内の単語情報とを
順次比較し、類似度（後述）が最大の認識単語候補を最
終的な認識単語として出力する知識処理部、７は帳票上
の各領域が知識処理を必要とする領域であるか否かを示
す情報と１、各領域の属性を示す情報がデープルとして
予め格納されている知識処理情報記憶部である。

なお本実施例において認識単語候補の類似度とは、認識
部２における候補順位から決まる得点と、知識辞書内の
単語情報との一致の有無から決まる得点との和と考えて
よい。

例えば認識単語候補１位の単語は１０点、２位は９点、
・・・等とし、さらに知識辞書内の単語情報と一致した
ものに５点、一致しないものには０点等を加えた総得点
が類似度となり、この値が最も高いものがａ終曲な認識
単語となる。

本実施例装置では、まずスキャナ部１が読取った１つの
文字記入領域分のイメージが認識部２に渡される。認識
部２では１文字ごとの認識を行なって幾つかの候補文字
を選択して１領域分をまとめ、認識単語候補として知識
処理制御部３に出力する。

続いて知識処理制御部３が知識処理情報記憶部７を検索
し、これら認識単語候補に対応する領域が知識処理を実
行すべき領域であるか否かを判断する。そして対象領域
が知識処理を必要としない領域であれば、前記認識単語
候補のうち、第１候補のものを最終的な認識単語として
出力する。

一方、対象領域が知識処理を必要とする領域であったな
らば、知識処理部３が知識処理情報記憶部７に示されて
いるテーブルの先頭から知識辞書名を取出し、知識ＲＭ
管理部４へ渡す。

知識辞書管理部４ではこの知識辞書名にしたがって複数
の知諏辞ＩＦ　５　ａ、５ｂ・・・から１つを選択し、
知識処理部６へ渡す。

同時に知識処理制御部３から知識処理部６へ１領域分の
認識単語候補が渡され、知識処理部６は各認識単語候補
と知識辞書とを比較する。

そして比較の結果、類似度が最も高くなった認識単語候
補が選ばれ、その類似度とともに知識処理制御部３へ渡
される。

知識処理制御部３は知識処理情報記憶部７内のテーブル
を再び参照し、続く知識辞書名があれば知識辞書管理部
４に新たな知識辞書名を渡し、知識処理部６において比
較を行なわせる。

ここで知識処理部６で得ちれた認識単語候補の類似度と
、先に得られている認識単語候補の類似度とを比較し、
類似度の大きい方の認識単語＠清とその類似度を知識処
理Ｍｍ部３に保持させておく。

この比較が知識処理情報記憶部７内のテーブルの知識辞
書名が無くなるまで繰返えし行なわれた後、知識処理制
御部３は類似度が最も高かった認識単語候補を最終的な
認識単語として出力する。

かくして本実施例装置によれば、複数の属性をもつ領域
に記入されている単語に、各属性に対応した複数の知識
辞書を順次対応させるので、既存の小容量の知！１１１
をそのまま使用することがでさ、複数の属性を色合して
いる大容量の知識辞書を作成する手間がかからない。

なお上述した実施例では、１つの単語と該当するすべて
の知識辞書とを順次比較し、最も類似度の高い単語を最
終的な認識単語としているが、知識辞書に優先順位を設
け、その順位にしたがってに比較を行ない、一定値以上
の類似度を有した単語を五終的な認識単語とする方式を
採用してもよい。

さらに本実施例装置において処理速度を向上させるなめ
に、例えば知識処理部６と知識処ｐ！！制御部３とに基
準類似度を予め与えておき、この基準類似度以上の類似
度をもつ単語があった場合、直ちにその単語を出力する
方式を採用してもよい。

［発明の効果コ以上説明したように本発明の文字認識装置は、帳票上の
複数の属性をもつ単語記入領域に記入された単語の認識
単語候補と各属性に対応した複数組の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
ので、それぞれの知識辞書は１つの属性に対応させてお
くだけでよい。

したがって帳票上に複数の属性をもつ単語記入領域が多
く存在する場合でも、知識辞書を作る際に手間がかから
ず、運用コストを低く抑えることができる。

【図面の簡単な説明】

第１図は本発明の一実施例の構成を示すブロック図、第
２図は従来の文字認識装置における知識処理の方法を概
念的に示す図である。１・・・・・・・・・スキャナ部２・・・・・・・・・認識部３・・・・・・・・・知識処理制御部４・・・・・・・・・知識辞書管理部５ａ、５ｂ・・・知識辞書

Claims

【特許請求の範囲】

（１）複数の単語記入領域を有する帳票から各単語のイ
メージを得る読取部と、前記単語記入領域に記入される
べき単語の属性を記憶する属性記憶部と、前記単語のイ
メージを認識し１つの単語ののイメージに対応する複数
の認識単語候補を得る認識部と、各単語の属性に対応し
て各認識単語候補の妥当性を判断するための情報が格納
されている複数組の知識辞書と、複数の属性をもつ前記
単語記入領域に記入されている単語のイメージの認識単
語候補と前記各属性に対応した複数の知識辞書とを対比
して最も妥当な認識単語候補を認識単語として出力する
知識処理部とを有してなることを特徴とする文字認識装
置。